غلبه بر چالشهای محدودیت منابع در بازیابی اطلاعات فارسی با بهره گیری از یادگیری نیمه نظارت شده و مدل های زبان بزرگ بومی

سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 19

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICTBC09_096

تاریخ نمایه سازی: 26 خرداد 1405

چکیده مقاله:

این مقاله یک بررسی جامع و تحلیلی بر روی چالش های محدودیت منابع در بازیابی اطلاعات فارسی ارائه می دهد. ما روش های یادگیری نیمه نظارت شده مانند نظارت از راه دور [۱] و مکانیزم های ترکیب دانش در FarsBase-KBP [۲] را برای غلبه بر کمبود داده تحلیل می کنیم، همچنین تاثیر مدل های زبان بزرگ بومی نظیر ParsBERT [۳] و چارچوب پیشرفته تولید مبتنی بر بازیابی افزوده [۴] در بهبود دقت پاسخ ها مورد ارزیابی قرار می گیرد. نتایج این بررسی نشان می دهد که استفاده از این چارچوب های نوین دقت مدل ها را در وظایف کلیدی افزایش داده و نیاز به نظارت انسانی را به حداقل می رساند.

کلیدواژه ها:

بازیابی اطلاعات ، پردازش زبان طبیعی ، یادگیری نیمه نظارت شده ، ترانسفورمر ، مدل زبان بزرگ ، استخراج رابطه ، متون فارسی ، نظارت از راه دور ، تولید مبتنی بر بازیابی افزوده

نویسندگان

بیتا اسماعیلی

دانشجوی کارشناسی مهندسی کامپیوتر دانشگاه علوم و فنون مازندران ایران

معصومه سادات روزبان

دانشجوی کارشناسی مهندسی کامپیوتر دانشگاه علوم و فنون مازندران ایران

معصومه احمدی

دانشجوی کارشناسی مهندسی کامپیوتر دانشگاه علوم و فنون مازندران ایران

بهاره جلالی

استادیار دانشگاه علوم و فنون مازندران ایران