غنی تر سازی منابع داده فارسی با پیوند نیمه خودکار به منابع وب معنایی

  • سال انتشار: 1396
  • محل انتشار: پنجمین کنفرانس بین المللی مهندسی برق و کامپیوتر با تاکید بر دانش بومی
  • کد COI اختصاصی: COMCONF05_566
  • زبان مقاله: فارسی
  • تعداد مشاهده: 305
دانلود فایل این مقاله

نویسندگان

مهران حسین زاده لموکی

دانشجوی کارشناسی ارشد، گروه مهندسی کامپیوتر و فناوری اطلاعات، موسسه آموزش عالی مهر آستان، گیلان، ایران

فاطمه احمدی آبکناری

استادیار، گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه پیام نور واحد رشت، ایران

چکیده

با توجه به رشد نمایی و حجم عظیم منابع وب، نیاز به خدمات حاشیه نویسی معنایی سریع و خودکار و نیمه خودکار اسناد وب و توسعه عملگرهای پیوند وجود دارد. پژوهش های صورت گرفته در حوزه وب معنایی بیشتر مختص زبان انگلیسی بوده و در این حوزه پژوهش های اندکی بر روی زبان فارسی صورت پذیرفته است. چراکه صرفا اعمال الگوریتم های توسعه یافته برای زبان انگلیسی بر روی منابع فارسی با توجه به پیچیدگی های زبان شناسی زبان فارسی امکان پذیر نیست. در این پژوهش با ساخت RDF از منابع خبری فارسی به غنی تر سازی پایگاه های داده فارسی از طریق اعمال عملگرهای ایجاد پیوند با منابع وب معنایی و به صورت خاص Dbpedia پرداخته شد. در این پژوهش با استفاده از گستره ای از عملگرهای توسعه یافته وب معنایی در نرم افزار رپیدماینر قابلیت اعمال این عملگرها بر منابع فارسی و ضعف اطلاعاتی Dbpedia در برقراری پیوند بر حسب بعضی از ویژگی های افزونه بررسی شد.

کلیدواژه ها

استخراج دانش، حاشیه نویسی، خدمات وب معنایی، داده کاوی، وب معنایی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.