ارائه یک روش بازیابی اطلاعات مبتنی بر شبکه های عصبی عمیق برای سامانه های پرسش و پاسخ پیچیده
- سال انتشار: 1403
- محل انتشار: فصلنامه پدافند الکترونیکی و سایبری، دوره: 12، شماره: 1
- کد COI اختصاصی: JR_PADSA-12-1_001
- زبان مقاله: فارسی
- تعداد مشاهده: 248
نویسندگان
دانشجوی دکتری ، دانشگاه علم و صنعت ، تهران ، ایران
دانشیار ، دانشگاه علم و صنعت ، تهران ، ایران
استاد، دانشگاه جامع امام حسین(ع)، تهران، ایران
چکیده
سامانههای پرسشپاسخ به عنوان نسل جدید موتورهای جستجو، توانایی بازیابی پاسخ مرتبط به پرسش های ارائه شده به زبان طبیعی را دارند. عموما این سامانهها از سه بخش اصلی پردازش پرسش، بازیابی اطلاعات و استخراج پاسخ تشکیل شدهاند و برای هر بخش روشهای متعددی معرفی شده است. یکی از مهمترین بخشها بازیابی اطلاعات و انتخاب پاراگرافهای مرتبط است. امروزه اغلب پرسش های کاربران در سامانه های پرسش و پاسخ از نوع پیچیده است. برای پاسخدهی به این گونه پرسش ها ابتدا نیازمند درک پرسش و سپس بازیابی اسناد مختلف است که از نظر واژگانی و معنایی به هم مرتبط هستند. در سالهای اخیر پیشرفت یادگیری مبتنی بر شبکههای عصبی عمیق از یک سو و معرفی مجموعهدادههای باکیفیت در مقیاس بزرگ از سوی دیگر باعث جلب توجه پژوهشگران به این حوزه شده است. در این پژوهش یک روش برای انتخاب پاراگرافهای مرتبط برای سامانههای پرسش پاسخ پیچیده روی مجموعه داده هات پات کیوای معرفی شده است. برای انتخاب پاراگرافهای مرتبط ابتدا نوع پرسش را با استفاده از یک شبکه عصبی عمیق تشخیص داده می شود. سپس با استفاده از مدلهای زبانی برت در چند گام پاراگرافهای مرتبط که شواهدی از پاسخ در آن نمایان باشد انتخاب میشوند. برای اینکار از روش استخراج کلمات کلیدی در پرسش استفاده شده است. نتایج بدست آمده نشان از بهتر بودن نتایج نسبت به روش پایه دارد.کلیدواژه ها
بازیابی اطلاعات, پرسش پاسخ پیچیده, انتخاب پاراگراف, شبکه&rlm, های عصبی عمیقاطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.