بررسی دسته بندی متون چند برچسبی و تاثیر برچسبها در ساختار سلسله مراتبی

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 687

فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ITCT04_054

تاریخ نمایه سازی: 17 آبان 1396

چکیده مقاله:

امروزه با افزایش حجم دادهها، امکان جمعآوری و طبقهبندی سریع دادهها توسط انسان غیرممکن شده است و نیاز به طبقهبندی و تحلیل خودکار از جایگاه ویژهای برخوردار است. دستهبندی یکی از مهمترین فرآیندهای موردمطالعه در حوزه یادگیری ماشین و دادهکاوی است که در برنامههای کاربردی فراوانیازجمله دستهبندی متن، تشخیص پزشکی، بیوانفورماتیک و... مورداستفاده قرار میگیرد. مسایل دستهبندی را میتوان بر اساس تعداد برچسبهای منتسب به هر یک از دادهها به دودسته کلی مسایل دستهبندی تک برچسبی و مسایل دستهبندی چند برچسبی تقسیم کرد. در مسایل دستهبندی تکبرچسبی، هر داده دارای یک برچسب منحصربهفرد است. اکثر مطالعات صورت گرفته در حوزه یادگیری ماشین مربوط به این نوع مسایل دستهبندی بوده است؛ اما مسایل مهم زیادی وجود دارد که حل آنها مستلزم انجام دستهبندی چند برچسبی است. در این مسایل، هر داده ممکن است به بیش از یکبرچسب منتسب شود. در طبقهبندی دادهها، ابتدا طی یک فرآیند نمونههای آموزشی به همراه برچسبهای آنها به یک الگوریتم یادگیری داده میشود تا ارتباط بین نمونهها و برچسبها را یاد بگیرد و سپس برچسب دادههای آزمایشی را پیشبینی کند. دادههای چند برچسبی دادههایی هستند که در آننمونهها میتوانند بیش از یک برچسب کلاس داشته باشند، بهعبارتدیگر هر نمونه توسط یک مجموعه از ML- ،Naïve-Bayse برچسبها نمایش دادهها میشود. در این گزارش به بررسی الگوریتمهای و شبکههای عصبی مصنوعی برای دستهبندی دادههای RBM ،SVM ،Random Forests ،KNNچند برچسبی میپردازیم. با ارزیابی روشهای پیشنهادی بر روی مجموعه دادههای مختلف به این نتیجه میرسیم که با استفاده از کاهش بعد فضای برچسبی الگوریتمها ازلحاظ دقت و صحت پیشبینی از کارایی بهتری برخوردار است.

نویسندگان

مرتضی شفیع زاده

دانشجوی کارشناسی ارشد هوش مصنوعی و رباتیکز دانشگاه شهید اشرفی اصفهانی

مهین بهرامی

دانشجوی کارشناسی ارشد هوش مصنوعی و رباتیکز دانشگاه شهید اشرفی اصفهانی