استخراج کلمات کلیدی اسناد فارسی
محل انتشار: سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران
سال انتشار: 1386
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 3,872
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ACCSI13_067
تاریخ نمایه سازی: 25 آبان 1386
چکیده مقاله:
این مقاله، یک روش آماری ترکیبی، برای استخراج کلمات کلیدی ١ اسناد فارسی، پیشنهاد کرده است. روش پیشنهادی مبتنی بر پیکره متنی ٢ میباشد. ابتدا عمل ریشه یابی و حذف کلمات عم می ٣انجام میگیرد. سپس ویژگی های آماری برای کلمات مختلف محاسبه شده و با استفاده از فازی سازی و اعمال قواعد فازی، کلمات کلیدی محتمل، انتخاب می شوند. گام بعدی محاسبه رخداد ه مزمان ٤ پیشین و پسین کلمات کلیدی محتمل، با کلمات تکرار شونده، ٥ در جملات سند است. با اعمال یک آستانه وفقی ٦ روی رخداد همزمان کلمات، کلمات کلیدی دو کلمهای را مشخص می- کنیم. بر خلاف اکثر روش های آماری که فقط کلمات کلیدی یک کلمهای را استخراج می کنند، استفاده از این روش کلمات کلیدی دو کلمهای نیز استخراج می شوند. استفاده از ترکیب روش فازی و رخداد همزمان کلمات بهبود خوبی را نشان می دهد و کلمات کلیدی بامعنیتری پیشنهاد می کند
کلیدواژه ها:
نویسندگان
مسلم محمدی جنقرا
عضو هیئت علمی دانشگاه آزاد اسلامی واحد ملکان
مرتضی آنالویی
استادیار دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :