رفع ابهام معنایی از واژگان هم آوا – هم نویسه فارسی: رویکرد پیکره بنیاد

  • سال انتشار: 1398
  • محل انتشار: دومین کنفرانس ملی بازیابی تعاملی اطلاعات
  • کد COI اختصاصی: IIIRC02_044
  • زبان مقاله: فارسی
  • تعداد مشاهده: 3019
دانلود فایل این مقاله

نویسندگان

حامد علی پوری حافظی

محقق کتابخانه بانک مرکزی جمهوری اسلامی ایران، دانشجوی دکتری علم اطلاعات و دانش شناسی دانشگاه شیراز

امیرسعید مولودی

استادیار گروه زبان های خارجی و زبانشناسی

محمدکریم بیات

رئیس اداره اطلاع رسانی کتابخانه مرکزی دانشگاه علامه طباطبائی

چکیده

در هر زبان کلماتی مبهم وجود دارند که دارای معانی متفاوتی هستند. مساله یافتن معنای صحیح واژگان دارای معانی متعدد یا به عبارتی واژگان هم آوا-همنویسه از مسایل جاری در حوزه پردازش زبانهای طبیعی محسوب میشود. انتخاب معنی درست ممکن است برای انسان بسیار واضح و آسان باشد ولی تشخیص اینکه کدام یک از معانی موجود برای یک کلمه بایستی در جمله خاص انتخاب شود برای ماشین دشوار است. از طرفی نیز در دنیای ماشینی امروز و تولید حجم انبوهی از داده ها در هر لحظه، بهره گیری از ماشین امری ضروری است. چهار رویکرد متفاوت برای رفع ابهام معنایی کلمات وجود دارد: رویکرد مبتنی بر دانش، رویکرد تحت نظارت، رویکرد نیمه نظارتی و رویکرد غیرنظارتی هستند که در پژوهش حاضر از رویرد غیرنظارتی بهره گرفته شده است. هدف پژوهش، بررسی امکان رفع ابهام معنایی از واژگان همآوا – همنویسه زبان فارسی با بهره گیری از همایندهای آنان بود که بر اساس یافته های پژوهش، این امکان وجود دارد و حتی در مورد برخی از واژگان، احتمال بسیار بالایی را برای این منظور میتوان ارائه کرد.

کلیدواژه ها

WSD، جناس تام، واژگان هم آوا – همنویسه، پیکره همشهری، رفع ابهام معنایی، همایندی، گور

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.