روشی جدید برای نگاشت عناصر پرس وجوهای ساده زبان طبیعی به دادههای دی بی پدیا

  • سال انتشار: 1396
  • محل انتشار: سومین کنفرانس ملی محاسبات توزیعی و پردازش داده های بزرگ
  • کد COI اختصاصی: DCBDP03_023
  • زبان مقاله: فارسی
  • تعداد مشاهده: 497
دانلود فایل این مقاله

نویسندگان

مریم جامه شورانی

گروه مهندسی نرمافزار، دانشکده مهندسی کامپیوتر، دانشگاه اصفهان، اصفهان

افسانه فاطمی

استادیار، گروه مهندسی نرمافزار، دانشکده مهندسی کامپیوتر، دانشگاه اصفهان، اصفهان

محمدعلی نعمت بخش

استاد، گروه مهندسی نرمافزار، دانشکده مهندسی کامپیوتر، دانشگاه اصفهان، اصفهان

چکیده

سیستمهای پرسشوپاسخ مبتنی بر دادههای پیوندی، به منظور ارایه پاسخ دقیق به پرسشهای زبان طبیعی کاربران و مبتنی برمجموعه حجیم دادههای پیوندی ارایه شده است. از مراحل اصلی کار این سیستمها، مرحله نگاشت عناصر پرسش زبان طبیعی به عناصر دادههای پیوندی میباشد. این مرحله عموما با چالشهایی مانند چندمفهومی و ابهام مواجه است که باعث کاهش دقت نگاشتو در نتیجه کاهش دقت سیستمهای پرسشوپاسخ میشود. در این مقاله راهکاری جدید برای نگاشت عناصر پرسوجوهای ساده زبان طبیعی به اطلاعات موجود در دادههای پیوندی دی بی پدیاارایه میشود. در این راهکار، پرسش زبان طبیعی به شکل گراف دریافت میشود. برای عناصر مجهول گراف مجموعهای از عناصر کاندید تعیین شده و سپس در مرحله رفع ابهام، مجموعه نهایی عناصر متناظر مشخص میشود. در این پژوهش، علاوه بر روابط صریح موجود در پرسش، روابط ضمنی نیز مورد بررسی واقع میشوند و عناصر کاندید برای آنها نیز تعیین میگردد.نتایج ارزیابی راهکار پیشنهادی، نشاندهندهی بهبود درصد نگاشت روابط ضمنی به عناصر متناظر، و بهبود معیارهای F-measure و Precision در مقایسه با آخرین کارهای انجامشده در این زمینه است.

کلیدواژه ها

دادههای پیوندی، سیستمهای پرسش وپاسخ، پرس وجو به زبان طبیعی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.