استخراج واژگان کلیدی از متون غیرساخت یافته با استفاده از الگوریتم بهینه سازی کلونی مورچگان (ACO)

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 446

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICCONF03_030

تاریخ نمایه سازی: 2 تیر 1397

چکیده مقاله:

داده های غیرساخت یافته، داده های هستند که هیچ فرم یا ساختار رسمی ندارند و معمولا در قالب متن خام هستند. این نوع داده ها شامل ایمیل ها، گزارش ها، مکالمه های تلفنی یا پیامک و غیره می باشند. استخراج واژگان کلیدی از متون غیرساخت یافته یکی از فعالیت های جالب توجه در متن کاوی محسوب می شود. در این مقاله روشی برای استخراج واژگان کلیدی از متن با استفاده از خوشه بندی مبتنی بر هوش ازدحامی با الگوریتم بهینه سازی کلونی مورچگان ارایه شده است. این امر پوشش موضوعاتی را که به طور خودکار در متن شناسایی شده است به حداکثر می رساند. نتایج تجربی نشان از برتری روش پیشنهادی نسبت به روش های پایه دارد.

نویسندگان

سینا دامی

استادیار گروه کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران ایران

احسان جوزدانی

دانشجوی کارشناسی ارشد IT، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران ایران