جویا: یک سیستم پرسش و پاسخ فارسی

  • سال انتشار: 1395
  • محل انتشار: مجله علوم رایانشی، دوره: 1، شماره: 3
  • کد COI اختصاصی: JR_CSJI-1-3_006
  • زبان مقاله: فارسی
  • تعداد مشاهده: 192
دانلود فایل این مقاله

نویسندگان

ایمان خانی جزنی

دانشجوی کارشناسی، دانشکدە ریاضی، آمار و علوم کامپیوتر، پردیس علوم، دانشگاه تهران

هدیه ساجدی

استادیار، دانشکده ریاضی، آمار و علوم کامپیوتر، پردیس علوم، دانشگاه تهران

چکیده

سیستم های پرسش و پاسخ زیر شاخه ای از علوم پردازش زبان طبیعی و بازیابی اطلاعات محسوب می شوند. سیستم های پرسش و پاسخ، پرسش را به یک زبان طبیعی (مثلا فارسی) دریافت کرده و جواب مختصر و دقیق را در اختیار کاربر قرار می دهند. بنابراین دیگر لازم نیست کاربر مانند سیستم های بازیابی اطلاعات پرسش خود را به کلید واژه ها تبدیل کند و پس از بازیابی، تعداد زیادی سند را مطالعه کند تا به جواب دلخواه خود برسد. پیشرفت های قابل توجهی در این زمینه، بخصوص در زبان انگلیسی انجام شده است، اما در زبان فارسی چنین سیستمی طراحی و پیاده سازی نشده است. در صورتیکه مزایای اینگونه سیستم ها و کاربردهای آنها مانند استفاده به عنوان جویشگر با قابلیت ویژه پرسش و پاسخ، دستیارهای همراه و غیره قابل توجه است. در این مقاله، مراحل تولید اولین سیستم پرسش و پاسخ فارسی در دامنه نامحدود و وب مبنا به نام "جویا" به همراه مجموعه داده های این سیستم، معرفی خواهد شد. جویا بصورت کلی شامل زیرمولفه های پردازش پرسش، بازیابی اطلاعات و استخراج جواب دقیق می باشد. به دلیل نبود مجموعه داده ارزیابی در زبان فارسی مجموعه داده ارزیابی برای این سیستم تهیه شده است. مجموعه داده ارزیابی شامل ۴۱۲ پرسش متنوع، و پاسخ متناظر آن است. سیستم پیشنهادی به ۸۰ درصد صحت دست پیدا کرده است.

کلیدواژه ها

سیستمهای پرسش و پاسخ فارسی, پردازش زبان طبیعی, بازیابی اطلاعات, پردازش پرسش, استخراج جواب

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.