استخراج رویداد ازمتن گزارش یک مسابقه ی فوتبال بااستفاده ازترکیب روشهای مبتنی برلغت وتحلیل گرامری

  • سال انتشار: 1392
  • محل انتشار: اولین همایش ملی رویکردهای نوین در مهندسی کامپیوتر و بازیابی اطلاعات
  • کد COI اختصاصی: BPJ01_161
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1618
دانلود فایل این مقاله

نویسندگان

علیرضا ذبیحی افراکتی

کارشناسی ارشدنرم افزار

میرعلی سیدی

استادیاردانشگاه تهران جنوب

علی معینی

دانشیاردانشگاه تهران

چکیده

افزایش روزافزون محیطهای رویدادگرسبب شده است که روشهای گوناگونی جهت پردازش رویدادها وکشف یک رویدادپیچیده ابداع شود این روشها توسط تطبیق رویدادهابا الگوهای تعریف شده به کشف یک رویداد پیچیده می پردازند این روشها برای پردازش رویدادهای نامتجانس راه حلی ارایه نداده اند متن غیرساختیافته خبری یک مثال عینی ازرویداد نامتجانس است درهرعبارت یا جمله ای خبری وقوع یک رویداد اعلان میشود اما ساختارمشخصی برای متن اعلان یک رویداد وجود ندارد وتعریف نشده است ازاین رو نیاز به ابداع روشی برای استخراج رویدادهای استاندارد ازمحیطهای نامتجانس ضروری به نظرمی رسد دراین تحقیق روشی ارایه شده که بکمک آن رویداد ازمتن غیرساخت یافته استخراج میشود این روش دارای دومرحله اصلی برای استخراج رویداد است درمرحله اول متن با قالبهای ازپیش تعریف شده مبتنی برانتولوژی دامنه تطبیق داده میشود و رویدادهای ممکن کشف میگردد درمرحله دوم به کمک تجزیه گراستنفورد گراف وابستگی جمله بدست می اید وبا استفاده ازقوانین تعریف شده مبتنی برانتولوژی دامنه وبالحاظ کردن نوع وابستگی موجود بین کلمات رویدادهای جدیدی کشف میگردد

کلیدواژه ها

استخراج اطلاعات، متن غیرساختیافته، گراف وابستگی، رویداد، آنتولوژی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.