ارائه روشی سریالی جهت دسته بندی خودکار متون مبتنی بر تکنیک های داده کاوی و یادگیری ماشین

معصومه علی نژاد; ایمان عطارزاده; ابراهیم بهروزیان نژاد

ارائه روشی سریالی جهت دسته بندی خودکار متون مبتنی بر تکنیک های داده کاوی و یادگیری ماشین

محل انتشار: اولین همایش ملی مهندسی برق و کامپیوتر در شمال کشور

سال انتشار: 1393

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,185

فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/330296

شناسه ملی سند علمی:

NCECN01_041

تاریخ نمایه سازی: 7 بهمن 1393

چکیده مقاله:

در این مقاله مدلی پیشنهاد می شود که با استفاده از روش ترکیبی به صورت متوالی از خروجی دسته بندها سعی در افزایش کارایی دسته بندی دارد. در مرحله انتخاب ویژگی از بین تکنیک های فیلتری موجود، با توجه به آزمایش های انجام شده، روش بهره ی اطلاعاتی انتخاب می شود تا پیچیدگی کمتری نسبت به تکنیک های پوششی داشته باشد. در مرحله یادگیری روش پیشنهادی، از روش دسته بندی به صورت متوالی با استفاده از ترکیب الگوریتم های دسته بندی ماشین بردار پشتیبان، بیز ساده و درخت تصمیم مورد ارزیابی قرار گرفته است، که ارزیابی روش پیشنهادی از ترکیب دو دسته بند SVM و J48 بهینه تر بوده است و دارای میانگین دقت 98.25 درصد، میانگین فراخوانی98.17 درصد، میانگین F-Measure98.20 درصد، معیار درستی 98.38 درصد و خطای دسته بندی 1.62 درصد بوده است. ارزیابی های انجام شده در محیط نرم افزار داده کاویRapid Miner نسخه 5.2 و بر روی مجموعه داده های اخبار رویترز_21578 بوده است. و در انتها روش پیشنهادی با روش سریالی ژانگ و همکاران که در مقاله خود ارائه داده اند مورد مقایسه قرار گرفته است در این مقاله تنها دو معیار Precision و F-Measure بیان شده است که در ارزیابی انجام شده روش پیشنهادی در معیار Precision و F-Measure بهینه تر بوده است.

کلیدواژه ها:

متن کاوی ، کاوش متن ، داده کاوی ، یادگیری ماشین ، استخراج دانش

نویسندگان

معصومه علی نژاد

دانشجوی کارشناسی ارشد،گروه کامپیوتر، دانشگاه آزاد اسلامی واحد علوم و تحقیقات خوزستان، اهواز، ایران.

ایمان عطارزاده

استادیار و عضو هیئت علمی، گروه کامپیوتر، دانشگاه آزاد اسلامی واحد دزفول، دزفول، ایران

ابراهیم بهروزیان نژاد

استادیار و عضو هیئت علمی، گروه کامپیوتر، دانشگاه آزاد اسلامی واحد شوشتر، شوشتر، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

بینا، بهاره؛ هگذر، مسعود ؛ ده موبد، آذین (1386) _ ...
علی نژاد، معصومه(1392) ؛ ارائه ی روشی با دقت و ...
Arturo M. R.(2006)؛ Selection strategies for multi-label text categorization. Journal ...
Cai R., Zhang Z., Hao Z.(2011)؛ BASSUM: A Bayesian semi- ...
Chang C., Lin C. J.(Retrived on 24 July 2013); LIBSVM: ...
Kanya N., Geetha S.(2007) Information extraction -a text mining approach. ...
Li Y, Hsu D. F., Chung S. M.(2009)؛ Combining multiple ...
Liu H., Sun J., Liu L, Zhang H.(2009)؛ Feature selection ...
A technique to choose the proper vector space models of ...
Sebastiani F.(2002)؛ Machine learning in automated text categorization. ACM Computing ...
Torshizi H. A., Tahmasebi H R.(2008)؛ Review of Classifier Combination ...
Weiss S., Indurkhya N.(1998)؛ Predictive Data Mining - A Practical ...
Zheng Z., Zhou S., Zhou A.(2004)؛ Sequential classifiers combination for ...

نمایش کامل مراجع