جویا: یک سیستم پرسش و پاسخ فارسی

سال انتشار: 1395
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 72

فایل این مقاله در 16 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_CSJI-1-3_006

تاریخ نمایه سازی: 14 بهمن 1402

چکیده مقاله:

سیستم های پرسش و پاسخ زیر شاخه ای از علوم پردازش زبان طبیعی و بازیابی اطلاعات محسوب می شوند. سیستم های پرسش و پاسخ، پرسش را به یک زبان طبیعی (مثلا فارسی) دریافت کرده و جواب مختصر و دقیق را در اختیار کاربر قرار می دهند. بنابراین دیگر لازم نیست کاربر مانند سیستم های بازیابی اطلاعات پرسش خود را به کلید واژه ها تبدیل کند و پس از بازیابی، تعداد زیادی سند را مطالعه کند تا به جواب دلخواه خود برسد. پیشرفت های قابل توجهی در این زمینه، بخصوص در زبان انگلیسی انجام شده است، اما در زبان فارسی چنین سیستمی طراحی و پیاده سازی نشده است. در صورتیکه مزایای اینگونه سیستم ها و کاربردهای آنها مانند استفاده به عنوان جویشگر با قابلیت ویژه پرسش و پاسخ، دستیارهای همراه و غیره قابل توجه است. در این مقاله، مراحل تولید اولین سیستم پرسش و پاسخ فارسی در دامنه نامحدود و وب مبنا به نام "جویا" به همراه مجموعه داده های این سیستم، معرفی خواهد شد. جویا بصورت کلی شامل زیرمولفه های پردازش پرسش، بازیابی اطلاعات و استخراج جواب دقیق می باشد. به دلیل نبود مجموعه داده ارزیابی در زبان فارسی مجموعه داده ارزیابی برای این سیستم تهیه شده است. مجموعه داده ارزیابی شامل ۴۱۲ پرسش متنوع، و پاسخ متناظر آن است. سیستم پیشنهادی به ۸۰ درصد صحت دست پیدا کرده است.

کلیدواژه ها:

نویسندگان

ایمان خانی جزنی

دانشجوی کارشناسی، دانشکدە ریاضی، آمار و علوم کامپیوتر، پردیس علوم، دانشگاه تهران

هدیه ساجدی

استادیار، دانشکده ریاضی، آمار و علوم کامپیوتر، پردیس علوم، دانشگاه تهران