استخراج کلمات کلیدی فارسی با استفاده از تکنیکهای دادهکاوی

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,035

فایل این مقاله در 17 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

COMCONF04_144

تاریخ نمایه سازی: 10 تیر 1396

چکیده مقاله:

با گسترش روزافزون متون فارسی و پشتیبانی اکثر نرمافزارها از زبان فارسی، روز به روز بر میزان تولید این اسناد افزوده میشود و همین مسیله نیاز به پردازشهایی بر روی متون دارد. استخراج کلمات کلیدی به عنوان یک تکنیک مهم برای بازگردانی اسناد، بازگردانی صفحات وب، خوشهبندی اسناد، خلاصهسازی متن، متنکاوی و موارد مشابه است. با استخراج کلمات کلیدی مناسب، میتوان بهراحتی اسناد را مطالعه کرده و رابطهی بین آنها را یافت. در این پژوهش با جمعآوری مجموعه اسنادی در حوزه رشته مهندسی کامپیوتر و انجام پیشپردازشی بر روی آنها ویژگیهایی همچون تعداد تکرار کلمات، شاخص پراکندگی کلمات و ... را استخراج کرده و در نهایت با استفاده از شبکه عصبی اقدام به استخراج کلمات کلیدی کرده که با به دست آوردن دقت 42,71 درصدی و صحت طبقهبندی 95 درصدی روش پیشنهادی از عملکرد قابل قبولی برخوردار بوده است.

نویسندگان

علی اصغر احمدی

گروه مهندسی کامپیوتر، دانشکده فنی و مهندسی، واحد کرمانشاه، دانشگاه آزاد اسلامی ، کرمانشاه، ایران.

مریم حبیبی

گروه مهندسی کامپیوتر، دانشکده فنی و مهندسی، واحد کرمانشاه، دانشگاه آزاد اسلامی ، کرمانشاه، ایران.

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :