تاثیرطبقه بندی داده های متنی در یادگیری ماشین براساس مجموعه داده ها

  • سال انتشار: 1404
  • محل انتشار: بیست و ششمین کنفرانس ملی مهندسی برق،کامپیوتر و مکانیک
  • کد COI اختصاصی: ECME26_112
  • زبان مقاله: فارسی
  • تعداد مشاهده: 52
دانلود فایل این مقاله

نویسندگان

آبتین بیات

گروه کامپیوتر سما تنکابن

چکیده

با افزایش و رشد منابع اطلاعاتی در وب و اینترانت های شرکتی، نیاز فوری به فناوری های موثر و کارآمد برای کمک به افراد در جستجو و مدیریت این منابع وجود دارد. یادگیری ماشینی، برای طبقه بندی یا دسته بندی متن، روش مهمی برای سازماندهی و مدیریت اطلاعات است. متن کاوی یکی از زمینه های است که به دنبال استخراج اطلاعات مفید، از داده های متنی بدون ساختار، به وسیله شناسایی و اکتشاف الگوها می باشد. یکی از تکنیک های مهم در متن کاوی طبقه بندی می باشد. طبقه بندی متن، اساسی ترین کار در پردازش زبان طبیعی بوده و یک فناوری موثر و کارآمد برای سازماندهی و مدیریت اطلاعات است. روش ها و الگوریتم های متفاوتی برای طبقه بندی متن بکار برده شده است که این روش ها در دقت و محاسبات متفاوت می باشند که نیاز به یک نظر سنجی جامع و به روز را افزایش می دهد. با این حال، افزایش چشمگیر در دسترس بودن داده های متنی عظیم از منابع مختلف، تعدادی از مسائل و چالش ها را برای طبقه بندی متن ایجاد می کند. هدف از این تحقیق، با تمرکز بر مدل های مختلفی از یادگیری، به بررسی و ارزیابی رویکردهای پیشرفته در طبقه بندی متن پرداخته می شود و یک مقایسه جامع بین تکنیک های مختلف و همچنین شناسایی جوانب مثبت و منفی معیارهای ارزیابی مختلف نیز در این بررسی ارائه شده است.

کلیدواژه ها

یادگیری عمیق، طبقه بندی متن، معیارهای ارزیابی، چالش ها.

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.