دسته بندی خودکار متون با استفاده از تکنیک های داده کاوی
محل انتشار: دومین همایش ملی کامپیوتر
سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,094
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NCCOS02_017
تاریخ نمایه سازی: 5 مهر 1393
چکیده مقاله:
داده کاوی شامل مجموعه ای از فنون است که به استخراج اطلاعات مفیدی که در انبوه داده ها به صورت مخفی و یا پنهان است، کمک می کند. دانش استخراج شده در قالب مد لها، الگوها و یا قواعدی ارائه میشود. این دانش یا اطلاعات به دست آمده میتواند ملاک تصمیم گیری های آتی، عملکردهای بعدی و یا تغییرات لازم جهت بهبود سیستم قرار گیرند. با توجه به رشد روزافزون دسترسی به اینترنت و اسناد الکترونیکی، دسته بندی خودکار متون اهمیت ویژه ای یافته است. دسته بندی متون عمل برچسب گذاری موضوعی متون بر مبنای یک مجموعه از پیش تعیین نشده میباشد. دسته بندی متون به طور کلی به دو بخش اصلی انتخاب ویژگی و الگوریتم یادگیری تقسیم می شود. در ارتباط با تکنیکهای انتخاب ویژگی و الگوریتم های یادگیری، رو شهای متنوعی ارائه شده است. هدف در تکنیکهای ارائه شده، بالا بردن دقت دسته بندی و رسیدن به کارایی مطلوب میباشد . در این مقاله مهم ترین و کاراترین تکنی کهای انتخاب ویژگی و نیز الگوریتم های یادگیری مورد تحلیل و بررسی قرار می گیرند و در نهایت پیشنهاداتی جهت استفادهبهینه تر از این تکنیکها صورت م یگیرد. با توجه به این نکته که هر کدام از رو شهای ارائه شده در کنار مزایای خود دارای معایبی نیز می باشند، بررسی این تکنیکها میتواند در ارائه تکنیکهای جدید که نقاط ضعف تکنیکهای پیشین را پوشش دهد، موثر باشد.
کلیدواژه ها:
نویسندگان
محمد بهروزیان نژاد
دانشگاه آزاد اسلامی واحد علوم و تحقیقات کرمان، گروه کامپیوتر، کرمان، ایران
ایمان عطارزاده
دانشگاه آزاد اسلامی واحد دزفول، گروه کامپیوتر، دزفول، ایران
مهدی حسین زاده
دانشگاه آزاد اسلامی واحد علوم و تحقیقات، گروه کامپیوتر، تهران، ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :