کاهش هالوسینیشن در مدل های زبانی بزرگ با استفاده از (RAG)
سال انتشار: 1405
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 31
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICMCAI02_032
تاریخ نمایه سازی: 9 تیر 1405
چکیده مقاله:
مدل های زبانی بزرگ(LLMs) با وجود پیشرفت های چشمگیر در تولید متن شبه انسانی، مستعد تولید هالوسینیشن(توهم) هستند; یعنی ارائه اطلاعاتی نادرست یا ساختگی با قاطعیتی بالا که می تواند قابلیت اطمینان و اعتماد پذیری این مدل ها در کاربرد های حساس را به شدت تضعیف کند. هدف این پژوهش، بررسی کارآمدی رویکرد"تولید تقویت شده با بازیابی"(RAG) به عنوان یک راه حل معماری محور برای کاهش پدیده هالوسینیشن است. یافته ها نشان می دهند که معماری RAG با جداسازی مرحله بازیابی دانش از پایگاه داده های معتبر از مرحله تولید پاسخ، بستر پاسخگویی مبتنی بر شواهد را فراهم می کند و با مهار تمایل مدل به اتکا صرف بر پارامتر هایدرونی خود، میزان خروجی های توهم زا را به طور قابل توجهی کاهش میدهد. این رویکرد ضمن افزایش قابلیت تفسیرپذیری با ارائه مستندات منبع، محدودیت هایی مانند وابستگی به کیفیت و جامعیت پایگاه دانش خارجی و چالش های زمان پاسخگویی را نیز به همراه دارد. در نتیجه می توان استدلال کرد که RAG یک گام مهم به سوی عملیاتی سازیLLM ها در محیط های واقعی است، اما پیاده سازی موفق آن مستلزم توجه همزمان به مولفه های بازیابی، یکپارچه سازی و تولید است.
کلیدواژه ها:
نویسندگان
سجاد حسینی
دانشجوی کاردانی رشته مهندسی نرم افزار، دانشگاه ملی مهارت، دانشکده شمسی پور، تهران، ایران