ارائه یک سیستم پرسش و پاسخ با رده بندی سوالات و جملات کاندید با استفاده از n-gram

  • سال انتشار: 1387
  • محل انتشار: چهاردهمین کنفرانس سالانه انجمن کامپیوتر ایران
  • کد COI اختصاصی: ACCSI14_235
  • زبان مقاله: فارسی
  • تعداد مشاهده: 2348
دانلود فایل این مقاله

نویسندگان

مسلم محمدی جنقرا

دانشگاه آزاد اسلامی واحد ملکان

مرتضی آنالویی

دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران، تهران، ایران

چکیده

در این مقاله یک روش مبتنی بر رده بندی و وزن دهی کلمات برای پاسخدهی به سوالات در حوزه زندگینامه پیشنهاد شده است. با استفاده از یک پیکره از پاسخ هایی که به صورت دستی استخراج شده اند، کلمات فنی به همراه bi-gram ها و uni-gram ها دراین حوزه، تعیین می شوند و سپس این کلمات وزن دهی شده و برای رده بندی سوالات مطرح شده و جملات کاندید برای پاسخ ، مورد استفاده قرار می گیرند. ما در این مقاله برای ارزیابی روش پیشنهادی سیستم، انواع سوالات را به سوالات در زمینه " تاریخ ولادت" ،" تاریخ وفات" محدود کرده ایم. با استفاده از این روش در واقع از تمام الگوهای پاسخ استفاده می شود ولی هیچ نیازی به ایجاد الگوها نمی باشد و در واقع یک روش مبتنی بر بازیابی اطلاعات توسعه داده شده می باشد. در این روش میزان MRR برابر 53 % بوده ولی میزان دقت خیلی امیدوار کننده و برابر 80% می باشد.

کلیدواژه ها

سیستم پرسش و پاسخ ، بازیابی اطلاعات ، پردازش زبان طبیعی ، سوالات با جواب کوتاه ، زبان فارسی ، حوزه زندگینامه

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.