ارتقای دقت دسته بندی کننده جملات پرسشی فارسی با استفاده از ویژگی خواسته پرسش مبتنی بر مدل اموزش پذیر حوزه های تصادفی شرطی
- سال انتشار: 1389
- محل انتشار: چهارمین کنفرانس داده کاوی ایران
- کد COI اختصاصی: IDMC04_087
- زبان مقاله: فارسی
- تعداد مشاهده: 1941
نویسندگان
دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد مشهد دانشکده فنی مهن
استادیار دانشگاه آزاد اسلامی واحد مشهد دانشکده فنی مهندسی
استادیار دانشگاه فردوسی مشهد دانشکده ادبیات و علوم انسانی گروه زبان ش
چکیده
دسته بندی کننده جملات پرسشی یکی از زیرسیستمهای مهم سیستم پاسخگویی به سوالات می باشد دراین سیستمها بوسیله روش های بازیابی و استخراج اطلاعات بازیابی متون در جهت شناسایی یک جواب صحیح صورت می گیرد بیشتر جملات پرسشی نوع دسته بندی خود را از طریق زیرترتیب کوتاهی از نشانه های پیوسته ی جمله نشان میدهند که آن را خواسته پرسش می نامیم این ویژگی نقش مهمی در ارتقای سیستم دسته بندی کننده جملات پرسشی دارد دراین تحقیق تاثیرات خواسته پرسش در دقت دسته بندی کننده ارزیابی می شود به همین منظور مجموعه داده ای شامل جملات پرسشی از متون فارسی تهیه و برچسب زنی می شود داده های برچسب خورده برای اموزش دسته بندی کننده جملات پرسشی و شناسایی کننده خواسته پرسش مورد استفاده قرار میگیرد همچنین با بکارگیری ترکیب الگوریتم ژنتیک و مدل حوزه های تصادفی شرط Conditional Random Fields (CRF) سعی می شود تا دقت شناسایی کننده خواسته پرسش ارتقا یابد.کلیدواژه ها
سیستمهای پاسخگویی به سوالات، دسته بندی جملات پرسشی، خواسته پرسش، الگوریتم ژنتیک Conditional Random Fieldsاطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.