PersianFarm: دیتاستی برای تطبیق آنتولوژی های فارسی

  • سال انتشار: 1394
  • محل انتشار: اولین کنفرانس بین المللی وب پژوهی
  • کد COI اختصاصی: IRANWEB01_005
  • زبان مقاله: فارسی
  • تعداد مشاهده: 896
دانلود فایل این مقاله

نویسندگان

هادی تابع الحجه

دانشجوی کارشناسی ارشد، گروه مهندسی کامپیوتر، دانشکده مهندسی، دانشگاه شهیدچمران اهواز، اهواز

بیتا شادگار

استادیار، گروه مهندسی کامپیوتر، دانشکده مهندسی، دانشگاه شهیدچمران اهواز، اهواز

چکیده

این مقاله، برای اولین بار مسئله تطبیق آنتولوژی فارسی را به صورت عملی بررسی می کند. تطبیق آنتولوژی در پیاده سازی وب معنایینقشی کلیدی دارد. با وجود تلاش پژوهشگران برای ساخت آنتولوژی های فارسی، متاسفانه تلاشی برای طراحی تطبیق گرهایآنتولوژی فارسی صورت نگرفته است. شاید بتوان بزرگترین چالش در طراحی تطبیق گرهای فارسی را عدم وجود مجموعه داده یمحک (دیتاست) فارسی دانست. در این مقاله یک مجموعه داده محک استاندارد و جامع برای تطبیق فارسی-فارسی معرفی می-شود. مجموعه داده محک فارسی شامل هفت آنتولوژی فارسی و یازده جفت تطبیق بین آنتولوژیها است و مطابق با مجموعه داده محک OntoFarm مربوط به کمپین OAEI، و براساس استانداردهای آن ایجاد شده است. در ادامه مقاله، عملکرد تعدادی از مهم ترین معیارهای محاسبه شباهت رشته ای (تطبیق گرهای رشته ای)، در تطبیق آنتولوژی های فارسی بررسی و ارزیابی می شوند. نتایج ارزیابی ها به صورت معیارهای ارزیابی دقت، فراخوانی و معیار F ارائه شده است.

کلیدواژه ها

تطبیق آنتولوژی فارسی، همترازی آنتولوژی فارسی، مجموعه داده محک تطبیق آنتولوژی فارسی، معیارهای شباهت معنایی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.