دسته بندی متون فارسی با استفاده از شبکه عصبی و بهره گیری از الگوریتم های LDA,PCA جهت کاهش ویژگی
محل انتشار: دومین همایش ملی کامپیوتر
سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 979
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NCCOS02_058
تاریخ نمایه سازی: 5 مهر 1393
چکیده مقاله:
در دنیای مدرن کنونی، دستیابی به اطلاعات ارزش بالایی دارد. با افزایش حجم اطلاعات، نیاز فوقالعاده به ابزارهایی که بتوانند در جستجو، فیلترنمودن و مدیریت منابع موثر باشند، کاملاً احساس میشود. دسته بندی متون، فرآیندی است که در آن متنها در یک یا چند دسته از قبل تعریف شده براساس محتوا یا زبان نگارش متن قرار میگیرند. در این مقاله کاربرد شبکه عصبی چند لایه پرسپترون MLP در دسته بندی مستندات نیمه ساخته یافته XML بر روی پایگاه داده روزنامه همشهری بررسی شده و دستاوردهای آن مورد ارزیابی قرار گرفته است. البته برای دستهبندی مستندات با کارآیی بالا، دقت در شناسایی و انتخاب ویژگی- های مهم، نقش بسزایی دارد. به همین علت تمرکز بر روی تکنیکهای پیش پردازش مستندات و به گونه ویژه، روشهای وزندهی ویژگی مورد بررسی و تحلیل قرار گرفته و یکی از روشها TFCRF برای وزن دهی به مستنداتی که به عنوان ورودی شبکه عصبی مورد مطالعه است، بکار رفته است. در این مقاله برای استخراج بهترین ویژگیها از روش تجزیه و تحلیل مولفه های اصلی PCA با ارزیاب KNN استفاده شده و سپس نتایج آن با روش جداکننده خطی LDA ترکیب شده، در نهایت شبکه عصبی انتخاب شده مورد تست و ارزیابی قرار گرفته است. نتایج به دست آمده نشان داد که دقت دستهبندی متون فارسی با روش پیشنهادی به صورت قابل توجهی افزایش خواهد یافت
کلیدواژه ها:
نویسندگان
مهدی برفامی
دانشکده کامپیوتر و فناوری اطلاعات، دانشگاه آزاد اسلامی بابل، ایران
سهیل فاطری
دانشکده کامپیوتر و فناوری اطلاعات، دانشگاه آزاد اسلامی بابل، ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :