غلبه بر چالشهای محدودیت منابع در بازیابی اطلاعات فارسی با بهره گیری از یادگیری نیمه نظارت شده و مدل های زبان بزرگ بومی

این مقاله یک بررسی جامع و تحلیلی بر روی چالش های محدودیت منابع در بازیابی اطلاعات فارسی ارائه می دهد. ما روش های یادگیری نیمه نظارت شده مانند نظارت از راه دور [۱] و مکانیزم های ترکیب دانش در FarsBase-KBP [۲] را برای غلبه بر کمبود داده تحلیل می کنیم، همچنین تاثیر مدل های زبان بزرگ بومی نظیر ParsBERT [۳] و چارچوب پیشرفته تولید مبتنی بر بازیابی افزوده [۴] در بهبود دقت پاسخ ها مورد ارزیابی قرار می گیرد. نتایج این بررسی نشان می دهد که استفاده از این چارچوب های نوین دقت مدل ها را در وظایف کلیدی افزایش داده و نیاز به نظارت انسانی را به حداقل می رساند.

کلیدواژه ها:

بازیابی اطلاعات ، پردازش زبان طبیعی ، یادگیری نیمه نظارت شده ، ترانسفورمر ، مدل زبان بزرگ ، استخراج رابطه ، متون فارسی ، نظارت از راه دور ، تولید مبتنی بر بازیابی افزوده

نویسندگان

بیتا اسماعیلی

دانشجوی کارشناسی مهندسی کامپیوتر دانشگاه علوم و فنون مازندران ایران

معصومه سادات روزبان

دانشجوی کارشناسی مهندسی کامپیوتر دانشگاه علوم و فنون مازندران ایران

معصومه احمدی

دانشجوی کارشناسی مهندسی کامپیوتر دانشگاه علوم و فنون مازندران ایران

بهاره جلالی

استادیار دانشگاه علوم و فنون مازندران ایران

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/2636763

شناسه ملی سند علمی:

ICTBC09_096

تاریخ نمایه سازی: 26 خرداد 1405

نحوه استناد به مقاله:

در صورتی که می خواهید در اثر پژوهشی خود به این مقاله ارجاع دهید، به سادگی می توانید از عبارت زیر در بخش منابع و مراجع استفاده نمایید:

اسماعیلی، بیتا و روزبان، معصومه سادات و احمدی، معصومه و جلالی، بهاره،1404،غلبه بر چالشهای محدودیت منابع در بازیابی اطلاعات فارسی با بهره گیری از یادگیری نیمه نظارت شده و مدل های زبان بزرگ بومی،نهمین همایش بین المللی مهندسی فناوری اطلاعات، کامپیوتر و مخابرات ایران،تهران،https://civilica.com/doc/2636763

در داخل متن نیز هر جا که به عبارت و یا دستاوردی از این مقاله اشاره شود پس از ذکر مطلب، در داخل پارانتز، مشخصات زیر نوشته می شود.
برای بار اول: (1404، اسماعیلی، بیتا؛ معصومه سادات روزبان و معصومه احمدی و بهاره جلالی)
برای بار دوم به بعد: (1404، اسماعیلی؛ روزبان و احمدی و جلالی)
برای آشنایی کامل با نحوه مرجع نویسی لطفا بخش راهنمای سیویلیکا (مرجع دهی) را ملاحظه نمایید.

علم سنجی و رتبه بندی مقاله

مشخصات مرکز تولید کننده این مقاله به صورت زیر است:

رتبه علمی دانشگاه علوم و فنون مازندران

نوع مرکز: موسسه غیرانتفاعی

تعداد مقالات: 1,578

در بخش علم سنجی پایگاه سیویلیکا می توانید رتبه بندی علمی مراکز دانشگاهی و پژوهشی کشور را بر اساس آمار مقالات نمایه شده مشاهده نمایید.

مقالات مرتبط جدید