ارایه یک روش ترکیبی مبتنی بر تکنیک های فراابتکاری و تخصیص پنهان دیریکله جهت بهبود خوشه بندی اسناد

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 449

فایل این مقاله در 6 صفحه با فرمت PDF و WORD قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CEITS02_039

تاریخ نمایه سازی: 30 دی 1397

چکیده مقاله:

امروز حجم عظیم اسناد در ادارات، سازمانها، شرکت های بزرگ و سایر سیستم های زیربط باعث ایجاد یک چالش عظیم در مدیریت این نوع داده ها شده است. تحلیل محتویات داده و گروه بندی آنها در شاخه های مرتبط نیز از جمله چالش های بسیاری از موتورهای جستجوگر، ژورنال ها و غیره است. تا کنون نیز روشهای مختلفی ارایه شده است که علارغم کارایی که دارند؛ اما همچنان با دقت کافی و مطلوبی نتوانسته اند به خوشه بندی اسناد بپردازند. بر این اساس، در این مقاله با بکارگیری تلفیقی از روشهای آماری تخصیص پنهان دیریکله و الگوریتم هوش مصنوعی زنبور عسل اقدام به خوشه بندی اسناد نموده ایم. مراحل روش پیشنهادی در این مقاله عبارتند از: 1) دریافت منبع داده و اعمال پیش پردازش بر روی آن 2) اعمال الگوریتم آماری دیریکله به منظور استخراج موضوعات از متن اسناد 3) اعمال الگوریتم زنبور عسل جهت خوشه بندی اسناد بر اساس موضوع. با شبیه سازی مشاهده گردید که میزان کیفیت فراخوانی و دقت خوشه بندی اسناد با روش پیشنهادی در مقایسه با سایر روش ها مثل الگوریتم های K-Means, GA, IBKCLUST و غیره بهبود داشته است.

نویسندگان

هدی فهندژ

گروه مهندسی کامپیوتر، واحد شیراز، دانشگاه آزاد اسلامی، شیراز، ایران

امین طوسی

گروه مهندسی کامپیوتر، واحد شیراز، دانشگاه آزاد اسلامی، شیراز، ایران