مرور روش های دسته بندی متون مبتنی بر الگوریتم های داده کاوی و یادگیری ماشین

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 466

فایل این مقاله در 11 صفحه با فرمت PDF و WORD قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICOCS04_047

تاریخ نمایه سازی: 25 فروردین 1400

چکیده مقاله:

دسته بندی متون به یک فناوری کلیدی برای رسیدگی و سازماندهی تعداد زیادی از اسناد تبدیل می شود. دسته بندی خودکار متون، عملیاتی است که می تواند متونی را با استفاده از برخی الگوریتم های داده کاوی و یادگیری ماشین به دسته های متن از پیش تعریف شده، مرتب کند. مهم ترین رویکردها برای سازماندهی و استفاده از حجم زیادی از اطلاعات به صورت غیر ساختاری تعریف می شوند. امروزه، دسته بندی متون در حال تبدیل شدن به یک زمینه گسترده در زمینه کاوش متن و پردازش زبان ها است. معنی کلمه، روابط معنایی بین اصطلاحات و غیره به منظور بهبود عملکرد دسته بندی ضروری است. دسته بندی خودکار متون به عنوان یک روش یادگیری ماشین تحت نظارت تلقی می شود. در این مقاله، تجزیه و تحلیل جامعی از رویکردهای مختلف دسته بندی متون مبتنی بر الگوریتم های داده کاوی و یادگیری ماشین انجام می شود. همچنین طیف گستردهای از الگوریتم های مورد استفاده برای دسته بندی متون مرور می شوند. پژوهش های مورد مطالعه عموماً از الگوریتم های یادگیری عمیق، شبکه عصبی کانولوشن، ماشین بردار پشتیبان، K نزدیکترین همسایه، درخت تصمیم، جنگل تصادفی، نایوبیز، رگرسیون لجستیک، مربع کای، مدل مخفی مارکوف و k-means استفاده کرده اند.

کلیدواژه ها:

دسته بندی ، متون ، الگوریتم های داده کاوی ، الگوریتم های یادگیری ماشین

نویسندگان

فاطمه زیرک

گروه مهندسی کامپیوتر، واحد دزفول، دانشگاه آزاد اسلامی، دزفول، ایران،