کاربرد مدل های مبتنی بر Transformer در دسته بندی متون علمی و پژوهشی

سال انتشار: 1403
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 117

فایل این مقاله در 17 صفحه با فرمت PDF و WORD قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CARSE08_335

تاریخ نمایه سازی: 11 اسفند 1403

چکیده مقاله:

این پژوهش به مقایسه مدل های یادگیری ماشین و یادگیری عمیق در زمینه طبقه بندی متن پرداخته است. هدف اصلی این مطالعه، بررسی تاثیر پیش پردازش داده ها، مانند حذف نویز، توکن سازی، حذف توقف واژه ها و ریشه یابی، بر دقت مدل های مختلف طبقه بندی متن و ارزیابی زمان پردازش آن ها بوده است. مدل های مورد بررسی شامل بیز ساده (NB)، ماشین بردار پشتیبان (SVM)، جنگل تصادفی(RF) ، شبکه عصبی مصنوعی (ANN)، شبکه عصبی بازگشتی (LSTM) و مدل BERT بودند. نتایج نشان داد که مدل های یادگیری عمیق، به ویژه مدل BERT، با دقت بالا و مقادیر F۱-score و نرخ فراخوانی بیشتر، بهترین عملکرد را از خود نشان دادند. همچنین، تاثیر مثبت پیش پردازش کامل بر بهبود دقت مدل ها و کاهش نویز داده ها به وضوح مشاهده شد. از سوی دیگر، مدل های یادگیری ماشین کلاسیک مانند بیز ساده و SVM، زمان پردازش کمتری داشتند و برای کاربردهای با منابع محدود و نیاز به پردازش سریع تر مناسب تر بودند. در نهایت، پژوهش به این نتیجه رسید که انتخاب مدل باید بر اساس نیاز به تعادل بین دقت و زمان پردازش انجام شود و بهینه سازی پیش پردازش داده ها می تواند تاثیر زیادی بر عملکرد مدل ها داشته باشد.

نویسندگان

مهدی کبوتری نیاز آبادی

گروه مهندسی کامپیوتر ،واحد مشهد ،دانشگاه آزاد اسلامی ،مشهد ،ایران

حسن منتظری مقدم

گروه مهندسی کامپیوتر ،واحد مشهد ،دانشگاه آزاد اسلامی ،مشهد ،ایران