ارائه یک سیستم پرسش و پاسخ با رده بندی سوالات و جملات کاندید با استفاده از n-gram
محل انتشار: چهاردهمین کنفرانس سالانه انجمن کامپیوتر ایران
سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,343
فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ACCSI14_235
تاریخ نمایه سازی: 26 مهر 1387
چکیده مقاله:
در این مقاله یک روش مبتنی بر رده بندی و وزن دهی کلمات برای پاسخدهی به سوالات در حوزه زندگینامه پیشنهاد شده است. با استفاده از یک پیکره از پاسخ هایی که به صورت دستی استخراج شده اند، کلمات فنی به همراه bi-gram ها و uni-gram ها دراین حوزه، تعیین می شوند و سپس این کلمات وزن دهی شده و برای رده بندی سوالات مطرح شده و جملات کاندید برای پاسخ ، مورد استفاده قرار می گیرند. ما در این مقاله برای ارزیابی روش پیشنهادی سیستم، انواع سوالات را به سوالات در زمینه " تاریخ ولادت" ،" تاریخ وفات" محدود کرده ایم. با استفاده از این روش در واقع از تمام الگوهای پاسخ استفاده می شود ولی هیچ نیازی به ایجاد الگوها نمی باشد و در واقع یک روش مبتنی بر بازیابی اطلاعات توسعه داده شده می باشد. در این روش میزان MRR برابر 53 % بوده ولی میزان دقت خیلی امیدوار کننده و برابر 80% می باشد.
کلیدواژه ها:
سیستم پرسش و پاسخ ، بازیابی اطلاعات ، پردازش زبان طبیعی ، سوالات با جواب کوتاه ، زبان فارسی ، حوزه زندگینامه
نویسندگان
مسلم محمدی جنقرا
دانشگاه آزاد اسلامی واحد ملکان
مرتضی آنالویی
دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران، تهران، ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :