تعیین مشابهت معنایی به روش بدون سرپرست با استفاده از قدم زنی تصادفی بر گراف جایگزینی زبانی

سال انتشار: 1397
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 372

فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_TJEE-48-1_022

تاریخ نمایه سازی: 17 تیر 1398

چکیده مقاله:

این مقاله به معرفی روشی برای تعیین مشابهت معنایی کلمات با استفاده از پیکره های تنک می پردازد. این روش با ارائه مفهوم جایگزین پذیری غیرمستقیم برای اولین بار و پیاده سازی آن از طریق گراف جایگزین پذیری عبارت ها توانسته است بر مشکل تنک بودن فضای زمینه در زبان های با منابع محدودتر مانند فارسی غلبه نماید. از طرف دیگر باید به این نکته اشاره نمود که برای تولید گراف جایگزینی لازم برای تعیین مشابهت معنایی می توان از پیکره های متنی به صورت مستقل از زبان بهره گرفت. نتایج ارزیابی ها با استفاده از دادگان آزمون مجموعه RG-65 که از دادگان متداول برای ارزیابی کیفیت تعیین مشابهت معنایی است، نشان می دهد که مقدار ضریب همبستگی Spearman این روش بین 0.03 تا 0.13 واحد بیش از سایر روش های بدون سرپرست موفق است.

نویسندگان

فاطمه کاوه یزدی

دانشگاه یزد - گروه مهندسی کامپیوتر|محقق ارشد در موتور جستجوی پارسی جو

علی محمد زارع بیدکی

دانشگاه یزد - گروه مهندسی کامپیوتر|مدیر پروژه موتور جستجوی پارسی جو

محمدرضا پژوهان

دانشگاه یزد - گروه مهندسی کامپیوتر