مرور روش های دسته بندی متون مبتنی بر الگوریتم های داده کاوی و یادگیری ماشین
سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 466
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICOCS04_047
تاریخ نمایه سازی: 25 فروردین 1400
چکیده مقاله:
دسته بندی متون به یک فناوری کلیدی برای رسیدگی و سازماندهی تعداد زیادی از اسناد تبدیل می شود. دسته بندی خودکار متون، عملیاتی است که می تواند متونی را با استفاده از برخی الگوریتم های داده کاوی و یادگیری ماشین به دسته های متن از پیش تعریف شده، مرتب کند. مهم ترین رویکردها برای سازماندهی و استفاده از حجم زیادی از اطلاعات به صورت غیر ساختاری تعریف می شوند. امروزه، دسته بندی متون در حال تبدیل شدن به یک زمینه گسترده در زمینه کاوش متن و پردازش زبان ها است. معنی کلمه، روابط معنایی بین اصطلاحات و غیره به منظور بهبود عملکرد دسته بندی ضروری است. دسته بندی خودکار متون به عنوان یک روش یادگیری ماشین تحت نظارت تلقی می شود. در این مقاله، تجزیه و تحلیل جامعی از رویکردهای مختلف دسته بندی متون مبتنی بر الگوریتم های داده کاوی و یادگیری ماشین انجام می شود. همچنین طیف گستردهای از الگوریتم های مورد استفاده برای دسته بندی متون مرور می شوند. پژوهش های مورد مطالعه عموماً از الگوریتم های یادگیری عمیق، شبکه عصبی کانولوشن، ماشین بردار پشتیبان، K نزدیکترین همسایه، درخت تصمیم، جنگل تصادفی، نایوبیز، رگرسیون لجستیک، مربع کای، مدل مخفی مارکوف و k-means استفاده کرده اند.
نویسندگان
فاطمه زیرک
گروه مهندسی کامپیوتر، واحد دزفول، دانشگاه آزاد اسلامی، دزفول، ایران،