ارایه مجموعه ای از ویژگی های آماری جهت تعیین انسجام متن در سیستم های پرسش و پاسخ تعاملی

  • سال انتشار: 1396
  • محل انتشار: سومین کنفرانس پردازش سیگنال و سیستم‎ های هوشمند ایران
  • کد COI اختصاصی: SPIS03_012
  • زبان مقاله: فارسی
  • تعداد مشاهده: 674
دانلود فایل این مقاله

نویسندگان

محمدمهدی حسینی

دانشجو دکترا، دانشکده کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی شاهرود، شاهرود،

مرتضی زاهدی

استادیار، دانشکده کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی شاهرود، شاهرود،

چکیده

یکی از معیارهایی که در زمینه ارزیابی سیستمهای پرسش و پاسخ تعاملی دارای اهمیت می باشد اندازه گیری اتوماتیک میزان انسجام متن خروجی سیستم از روی سوالها و پاسخ های رد و بدل شده، بین کاربر و سیستم است. در این مقاله یک راه حل اتوماتیک برای تعیین میزان انسجام متن تولید شده، ارایه شده است. در روش پیشنهادی، مجموعهای از ویژگی های آماری که بر اساس N- گرم های مختلف و بزرگترین رشته مشترک تعریف شده، پیشنهاد شده است که نتایج حاصل حاکی از دقت بالای ویژگیهای پیشنهادی در تعیین انسجام متن میباشد. برای ایجاد پایگاه داده از مکالمات رد و بدل شده بین کاربران و سیستمها، از چهار سیستم پرسش و پاسخ تعاملی موجود استفاده گردید. بر اساس خروجی سیستمها، تعداد 540 نمونه به عنوان داده مناسب در نظر گرفته شد تا مجموعه تست و آموزش بر اساس آن ایجاد گردید. سپس پیش پردازش بر روی مکالمات صورت پذیرفت و در مرحله بعد استخراج ویژگی صورت پذیرفت و بر اساس آن ماتریس ویژگی تشکیل گردید. در نهایت با استفاده از دسته بندی کنندههای مختلف به طبقه بندی متنها پرداخته شد که دسته بندی کننده SVM بر اساس معیار F با 0/81 درصد به عنوان بهترین دسته بند کننده انتخاب گردید.

کلیدواژه ها

ارزیابی، سیستم پرسش و پاسخ تعاملی، بردار ماشین پشتیبان، ویژگی آماری

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.