یک روش جدید برای استخراج کلمات و عبارات کلیدی تک سنده فارسی با استفاده از تعیین حدود جمله

سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 889

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

FJCFIS02_336

تاریخ نمایه سازی: 26 تیر 1392

چکیده مقاله:

در این مقاله، از یک روش جدید برای استخراج واژههای کلیدی سند فارسی استفاده شده است. ویژگیهای آماری برای واژههای مختلف محاسبه شده و با استفاده از اعمال قواعد، واژههای کلیدی محتمل، انتخاب میشوند. گام بعدی محاسبه رخداد همزمان (co-occurrence)پیشین و پسین واژههای کلیدی محتمل، با واژههای تکرار شونده در جملات سند است. با استفاده از این روش بر خلاف اکثر روشهای آماری که فقط واژههای کلیدی یک واژهای را استخراج میکنند، واژههای کلیدی بیش از یک واژهای نیز استخراج میشوند. استفاده از روش رخداد همزمان بهبود خوبی را نشان میدهد و واژههای کلیدی بامعنی پیشنهاد میکند. عمل حذف واژههایعمومیstopwords) که به عنوان پیشپردازش روی اسناد انجام میشد در این روش بصورت پسپردازش انجام شده که واژههای کلیدیچتد واژهای نیز بدست آیند

نویسندگان

مجید ابرانپور

دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت ایران تهران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • _ _ Document using Word C ooccumrenct Statistical Information, " ...
  • and Applications (AICCSA-07), Amman, Jordan, May 2007. ...
  • G. Salton, M.J Mc Gill, "Introduction to _ Information Retrieval", ...
  • R. Baeza-Yates, B. Ribeiro-Neto, _ _ Retrieval", ACM Press, 1999. ...
  • نمایش کامل مراجع