بهبود دقت طبقهبندی اسناد با استفاده از ترکیب الگوریتمهای یادگیری ماشین
محل انتشار: چهارمین کنفرانس بین المللی مهندسی برق و کامپیوتر
سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 395
فایل این مقاله در 20 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
COMCONF04_264
تاریخ نمایه سازی: 10 تیر 1396
چکیده مقاله:
باتوجه به داده های عظیم موجود درپایگاه های داده اینترنت و مراکزاطلاعاتی طبقه بندی متن یک نقش مهم درسازمان دهی بازیابی و جستجوی اطلاعات موجود دراین پایگاه های داده می باشد درواقع می توان گفت طبقه بندی متن اختصاص دادن یک متن به یک طبقه ازپیش تعیین شده می باشد برایاختصاص یافتن یک متن به یک طبقه خاص ازویژگیهای متن موجود استفاده میشود و باتوجه به ویژگیهای فراوانی که برای متون وجود دارد یک چالش اساسی انخاب زیرمجموعه ای ازویژگیهای مناسب برای یک متن می باشد ازاین رو دراین مقاله ازفیلترهای مختلفی جهت انتخاب ویژگی ازجمله حذف کلمات متوقف کننده n-gram و ... استفاده شده است دراین پژوهش ازمجموعه داده استاندارد خبرگزاری رویترز Reuters-21578 با8دسته مختلف و درمجموعه بیش از7000 سندمتنی استفاده شده است ازالگوریتم های ترکیبی جهت طبقه بندی استفاده کرده ایم که نتایج حاصل ازآزمایشها انجام شده برروی مجموعه داده نشان میدهد که الگوریتم پیشنهادی بهترین کارایی جهت طبقه بندی متن را داشته و باعث بهبود دقت و بازخوانی جهت طبقه بندی متن شده است باتوجه به نتایج شبیه سازی میزان دقت طبقه بندی اسناد برابر 96.66درصد شده است
کلیدواژه ها:
نویسندگان
حدیث شعیری
دانشجویی کارشناسی ارشد رشته نرم افزار، دانشگاه آزاد اسلامی واحد بروجرد
ابراهیم شیری
استادیار دانشکده ریاضی و علوم کامپیوتر دانشگاه صنعتی امیر کبیر
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :