رده بندی متون فارسی با استفاده از ماشین بردار پشتیبان مبتنی بر روش های انتخاب ویژگی PCA و الگوریتم ژنتیک

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 837

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICEEE07_194

تاریخ نمایه سازی: 19 اردیبهشت 1395

چکیده مقاله:

در این مقاله رده بندی اسناد و متون فارسی با استفاده از ماشین بردار پشتیبان (SVM) پیشنهاد شده است. این روش یکی از بهترین روشها در ردهبندی متون می باشد که یکی از روش های یادگیری با نظارت است اطلاعات را ازفضای حاضر به فضای برداری دیگری عموما با ابعاد بیشتر که در آن الگوریتم های یادگیری خطی قابل کاربرد است نگاشت می کند. باتوجه به حجم زیاد ویژگی ها در متون فارسی در این مقاله برای انتخاب و کاهش ویژگی های مهم که نقش زیادی در تایین دسته متون دارند ابتدا با استفاده از روش TFCRF به کلمات وزن دهی انجام می شود سپس از روش های PCA و الگوریتم ژنتیک استفاده شده است . نتایج تجربی نشان می دهد، که این روش میتواند با دقت 78 % عمل ردهبندی را انجام دهد.

نویسندگان

ایمان ابراهیمی

دانشگاه آزاد اسلامی واحد علوم و تحقیقات بوشهر ، گروه مهندسی کامپیوتر ، هوش مصنوعی بوشهر ، ایران

مهدی صادق زاده

دانشگاه آزاد اسلامی واحد ماهشهر گروه مهندسی کامپیوتر ماهشهر ، ایران

احمد کشاورز

دانشگاه دولتی خلیج فارس واحد بوشهر ، گروه مهندسی برق بوشهر ، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :