کاهش هالوسینیشن در مدل های زبانی بزرگ با استفاده از (RAG)

سجاد حسینی

کاهش هالوسینیشن در مدل های زبانی بزرگ با استفاده از (RAG)

محل انتشار: دومین کنفرانس بین المللی مدیریت، علوم کامپیوتر و هوش مصنوعی

سال انتشار: 1405

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 31

فایل این مقاله در 7 صفحه با فرمت PDF و WORD قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/2651111

شناسه ملی سند علمی:

ICMCAI02_032

تاریخ نمایه سازی: 9 تیر 1405

چکیده مقاله:

مدل های زبانی بزرگ(LLMs) با وجود پیشرفت های چشمگیر در تولید متن شبه انسانی، مستعد تولید هالوسینیشن(توهم) هستند; یعنی ارائه اطلاعاتی نادرست یا ساختگی با قاطعیتی بالا که می تواند قابلیت اطمینان و اعتماد پذیری این مدل ها در کاربرد های حساس را به شدت تضعیف کند. هدف این پژوهش، بررسی کارآمدی رویکرد"تولید تقویت شده با بازیابی"(RAG) به عنوان یک راه حل معماری محور برای کاهش پدیده هالوسینیشن است. یافته ها نشان می دهند که معماری RAG با جداسازی مرحله بازیابی دانش از پایگاه داده های معتبر از مرحله تولید پاسخ، بستر پاسخگویی مبتنی بر شواهد را فراهم می کند و با مهار تمایل مدل به اتکا صرف بر پارامتر هایدرونی خود، میزان خروجی های توهم زا را به طور قابل توجهی کاهش میدهد. این رویکرد ضمن افزایش قابلیت تفسیرپذیری با ارائه مستندات منبع، محدودیت هایی مانند وابستگی به کیفیت و جامعیت پایگاه دانش خارجی و چالش های زمان پاسخگویی را نیز به همراه دارد. در نتیجه می توان استدلال کرد که RAG یک گام مهم به سوی عملیاتی سازیLLM ها در محیط های واقعی است، اما پیاده سازی موفق آن مستلزم توجه همزمان به مولفه های بازیابی، یکپارچه سازی و تولید است.

کلیدواژه ها:

مدل های زبانی بزرگ ، هالوسینیشن ، تولید تقویت شده با بازیابی ، بازیابی اطلاعات ، پردازش زبان طبیعی

نویسندگان

سجاد حسینی

دانشجوی کاردانی رشته مهندسی نرم افزار، دانشگاه ملی مهارت، دانشکده شمسی پور، تهران، ایران