استفاده ازترکیب شبکه های عصبی جهت دسته بندی متون فارسی مبتنی برالگوریتم های GA,KNN,PCA جهت کاهش ویژگی

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 905

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

BPJ01_632

تاریخ نمایه سازی: 29 دی 1392

چکیده مقاله:

باافزایش حجم اطلاعات نیازفوق العاده به ابزارهایی که بتوانند درمدیریت منابع موثرباشند کاملا احساس میشود دسته بندی متون فرایندی است که درآن متن ها دریک یاچنددسته ازقبل تعریف شده براساس محتوا قرارمیگیرند دراین مقاله ازترکیب دوشبکه عصبی چندلایه پرسپترون MLP دردسته بندیمستندات نیمه ساختیافته XML برروی پایگاه داده روزنامه همشهری استفاده شده است البته برای دسته بندی مستندات انتخاب ویژگیهای مهم نقش بسزایی دارد لذا تمرکز بررویتکنیکهای پیش پردازش مستندات و به گونه ویژه روشهای وزندهی ویژگیهای مورد بررسی قرارگرفته و یکی ازروشها TFCRF برای وزن دهی به مستندات انتخاب شده است سپس به کمک روش تجزیه و تحلیل مولفه های اصلی PCA به ارزش دهی ویژگیها پرداخته و با الگوریتم KNN تعدادی ازآنها انتخاب شده و به عنوان ورودی یکی ازشبکه های عصبی استفاده میشود درمرحله بعد ازویژگیهای ارزش دهی شده به کمک الگوریتم GA تعدادی ویژگی انتخاب شده و به عنوان ورودی یکی دیگر ازشبکه های عصبی استفاده میشود سپس نتایج خروجی این دوشبکه به کمک جمع جبری بایکدیگر ترکیب شده درنهایت موردتست و ارزیابی قرارگرفته است نتایج بدست امده نشان میدهددسته بندیمتون بادقت بالایی انجام یافته است

کلیدواژه ها:

نویسندگان

مهدی برفامی

دانشگاه آزاد اسلامی بابل

سهیل فاطری

دانشگاه آزاد اسلامی بابل