استخراج کلمات کلیدی اسناد فارسی

مسلم محمدی جنقرا; مرتضی آنالویی

استخراج کلمات کلیدی اسناد فارسی

محل انتشار: سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران

سال انتشار: 1386

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 4,197

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/41661

شناسه ملی سند علمی:

ACCSI13_067

تاریخ نمایه سازی: 25 آبان 1386

چکیده مقاله:

این مقاله، یک روش آماری ترکیبی، برای استخراج کلمات کلیدی ١ اسناد فارسی، پیشنهاد کرده است. روش پیشنهادی مبتنی بر پیکره متنی ٢ میباشد. ابتدا عمل ریشه یابی و حذف کلمات عم می ٣انجام میگیرد. سپس ویژگی های آماری برای کلمات مختلف محاسبه شده و با استفاده از فازی سازی و اعمال قواعد فازی، کلمات کلیدی محتمل، انتخاب می شوند. گام بعدی محاسبه رخداد ه مزمان ٤ پیشین و پسین کلمات کلیدی محتمل، با کلمات تکرار شونده، ٥ در جملات سند است. با اعمال یک آستانه وفقی ٦ روی رخداد همزمان کلمات، کلمات کلیدی دو کلمهای را مشخص می- کنیم. بر خلاف اکثر روش های آماری که فقط کلمات کلیدی یک کلمهای را استخراج می کنند، استفاده از این روش کلمات کلیدی دو کلمهای نیز استخراج می شوند. استفاده از ترکیب روش فازی و رخداد همزمان کلمات بهبود خوبی را نشان می دهد و کلمات کلیدی بامعنیتری پیشنهاد می کند

کلیدواژه ها:

استخراج کلمات کلیدی ، اسناد فارسی ، رخداد همزمان ، فازی

نویسندگان

مسلم محمدی جنقرا

عضو هیئت علمی دانشگاه آزاد اسلامی واحد ملکان

مرتضی آنالویی

استادیار دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

بشیری، حسن، کربلائی، فاطمه، موسوی، شیرین، طراحی و ارزیابی نمایه‌ساز ...
G. Salton, C. Buckley. 00Term weighting approaches in automatic text ...
D. Bracewell, F. Ren and S. Kuroiwa. *Multilingual Single Document ...
Y. Matsuo, M. Ishizuka, "Keyword Extraction from a Single Document ...
M. Makrehchi, M. Kamel, *A .fuzzy set approach to extracting ...
K. Sheykh Esmaili, A. Rostami, "List of Persian Stopwords", Technical ...
K. Taghva, R. Beckley and M. Sadeh. 3A Stemming Algorithmfor ...
Coding and Computing (ITXX05) - Volume I pp. 158- 162. ...
_ Mokhtaripour, S. Jahanpour. «Introduction to a rew Farsi _ ...
M.F. Porter, "An Algorithm for suffix stripping". Program, 14(3): 130t137, ...
K. Sheykh Esmaili, H. Abolhassani, M. Neshati, E. Behrangi, A. ...
G. Salton, M.J Mc Gill, "Introduction to Modern Information Retrieval", ...
R. Baeza-Yates, B. Ribeiro-Neto, "Modern Information Retrieval", ACM Press, 1999. ...

نمایش کامل مراجع