ارائه روشی جهت دسته بندی متون مبتنی بر تکنیک های داده کاوی با الگوریتم های منفرد
محل انتشار: اولین همایش ملی پژوهش های مهندسی رایانه
سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,023
فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
RCEITT01_256
تاریخ نمایه سازی: 11 اردیبهشت 1394
چکیده مقاله:
دادهکاوی به فرایند استخراج اطلاعات ناشناخته و مفید از انبوهی از دادهها اطلاق میگردد. امروزه بخش قابلتوجهی از اطلاعات موجود در پایگاه دادههای متنی ذخیره میشود که از مجموعه بزرگی از اسناد و منابع مختلف، از قبیل اخبار، مقالات علمی، کتاب،کتابخانههای دیجیتالی، پیامهای ایمیل و صفحات وب تشکیلشده است. متنکاوی دانش استخراج اطلاعات از متن بدون ساختار است. به عبارتی میتوان متنکاوی را بهعنوان روشها و الگوریتمهایی از فیلدهای یادگیری ماشین و تکنیکهای آماری باهدف پیدا کردن الگوهای مفید در متن در نظر گرفت. یکی از مهمترین تکنیکهای متنکاوی، دستهبندی متون است. دستهبندی متون بدینمعنی است که اسناد متنی موجود را به چند دسته از قبل تعریفشده که اسناد متعلق به آنها هستند، نسبت دهیم. در این مقاله چندین الگوریتم درخت تصمیم و بیز ساده به همراه ماشین بردار پشتیبان روی منبع داده همشهری آزمایش شده است.
کلیدواژه ها:
نویسندگان
مصطفی چراغی
دانشگاه آزاد اسلامی واحد علوم و تحقیقات، گروه کامپیوتر، فارس، ایران
محمدحسین یکتایی
دانشگاه آزاد اسلامی واحد آبادان، گروه کامپیوتر، خوزستان، ایران
منصور امینی لاری
دانشگاه آزاد اسلامی واحد علوم و تحقیقات فارس، گروه فناوری اطلاعات و کامپیوتر، شیراز، ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :