استفاده ازترکیب شبکه های عصبی جهت دسته بندی متون فارسی مبتنی برالگوریتم های GA,KNN,PCA جهت کاهش ویژگی
سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 905
فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
BPJ01_632
تاریخ نمایه سازی: 29 دی 1392
چکیده مقاله:
باافزایش حجم اطلاعات نیازفوق العاده به ابزارهایی که بتوانند درمدیریت منابع موثرباشند کاملا احساس میشود دسته بندی متون فرایندی است که درآن متن ها دریک یاچنددسته ازقبل تعریف شده براساس محتوا قرارمیگیرند دراین مقاله ازترکیب دوشبکه عصبی چندلایه پرسپترون MLP دردسته بندیمستندات نیمه ساختیافته XML برروی پایگاه داده روزنامه همشهری استفاده شده است البته برای دسته بندی مستندات انتخاب ویژگیهای مهم نقش بسزایی دارد لذا تمرکز بررویتکنیکهای پیش پردازش مستندات و به گونه ویژه روشهای وزندهی ویژگیهای مورد بررسی قرارگرفته و یکی ازروشها TFCRF برای وزن دهی به مستندات انتخاب شده است سپس به کمک روش تجزیه و تحلیل مولفه های اصلی PCA به ارزش دهی ویژگیها پرداخته و با الگوریتم KNN تعدادی ازآنها انتخاب شده و به عنوان ورودی یکی ازشبکه های عصبی استفاده میشود درمرحله بعد ازویژگیهای ارزش دهی شده به کمک الگوریتم GA تعدادی ویژگی انتخاب شده و به عنوان ورودی یکی دیگر ازشبکه های عصبی استفاده میشود سپس نتایج خروجی این دوشبکه به کمک جمع جبری بایکدیگر ترکیب شده درنهایت موردتست و ارزیابی قرارگرفته است نتایج بدست امده نشان میدهددسته بندیمتون بادقت بالایی انجام یافته است
کلیدواژه ها:
استخراج ویژگی ، دسته بندی متون ، شبکه عصبی چندلایه پرسپترون ، مستندات نیمه ساختیافته ، وزن دهی ویژگی
نویسندگان
مهدی برفامی
دانشگاه آزاد اسلامی بابل
سهیل فاطری
دانشگاه آزاد اسلامی بابل