ارائه یک سیستم پرسش و پاسخ با رده بندی سوالات و جملات کاندید با استفاده از n-gram
- سال انتشار: 1387
- محل انتشار: چهاردهمین کنفرانس سالانه انجمن کامپیوتر ایران
- کد COI اختصاصی: ACCSI14_235
- زبان مقاله: فارسی
- تعداد مشاهده: 2420
نویسندگان
دانشگاه آزاد اسلامی واحد ملکان
دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران، تهران، ایران
چکیده
در این مقاله یک روش مبتنی بر رده بندی و وزن دهی کلمات برای پاسخدهی به سوالات در حوزه زندگینامه پیشنهاد شده است. با استفاده از یک پیکره از پاسخ هایی که به صورت دستی استخراج شده اند، کلمات فنی به همراه bi-gram ها و uni-gram ها دراین حوزه، تعیین می شوند و سپس این کلمات وزن دهی شده و برای رده بندی سوالات مطرح شده و جملات کاندید برای پاسخ ، مورد استفاده قرار می گیرند. ما در این مقاله برای ارزیابی روش پیشنهادی سیستم، انواع سوالات را به سوالات در زمینه " تاریخ ولادت" ،" تاریخ وفات" محدود کرده ایم. با استفاده از این روش در واقع از تمام الگوهای پاسخ استفاده می شود ولی هیچ نیازی به ایجاد الگوها نمی باشد و در واقع یک روش مبتنی بر بازیابی اطلاعات توسعه داده شده می باشد. در این روش میزان MRR برابر 53 % بوده ولی میزان دقت خیلی امیدوار کننده و برابر 80% می باشد.کلیدواژه ها
سیستم پرسش و پاسخ ، بازیابی اطلاعات ، پردازش زبان طبیعی ، سوالات با جواب کوتاه ، زبان فارسی ، حوزه زندگینامهمقالات مرتبط جدید
- تحلیل انطباقی کیفیت و میزان محبوبیت خدمات ابری با بررسی و مقایسه رتبه بندی Tranco و رتبه بندی عملکردی شرکت های ابری
- طبقه بندی سیگنال های EEG ثبت شده از قشر پیش پیشانی به منظور کشف اثر موسیقی در شدت احساسات با استفاده از شبکه عصبی مصنوعی و پرسشنامه
- ارائه رویکردی برای مدیریت ریسک در پروژه های نرمافزاری با استفاده از خوشه بندی تجمعی
- تحلیل احتمالنقض ترتیب علیتی پیام ها در یک الگوریتم پخش علیتی در سیستمهای توزیع شده
- بهینه سازی به سبک گربه های شنی: الگوریتمی برای جستجوی کارآمد و مدیریت ازدحام
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.