ارزیابی کارایی مدلهای دسته بندی خودکار متون

محمد بهروزیان نژاد; ابراهیم بهروزیان نژاد

ارزیابی کارایی مدلهای دسته بندی خودکار متون

محل انتشار: همایش ملی مهندسی کامپیوتر و فناوری اطلاعات

سال انتشار: 1392

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,174

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/254265

شناسه ملی سند علمی:

NCCEB01_101

تاریخ نمایه سازی: 18 خرداد 1393

چکیده مقاله:

دسته بندی خودکار متون به طور کلی به دو بخش اصلی انتخاب ویژگی و الگوریتم یادگیری تقسیم میشود.در ارتباط با تکنیکهای انتخاب ویژگی و الگوریتم های یادگیری، روشهای متنوعی ارائه شده است. هدف در تکنیک های ارائه شده، بالا بردن دقت دسته بندی و رسیدن به کارایی مطلوب میباشد. در این مقاله مهمترین و کاراترین تکنیک های انتخاب ویژگی و نیز الگوریتم هاییادگیری مورد تحلیل و بررسی قرار میگیرند و در نهایت پیشنهاداتی جهت استفاده بهینه تر از این تکنیک ها صورت میگیرد. با توجه به این نکته که هر کدام از روش های ارائه شده در کنار مزایای خود دارای معایبی نیز میباشند، بررسی این تکنیک ها میتواند در ارائه تکنیک های جدید که نقاط ضعف تکنیک های پیشین را پوشش دهد، موثر باشد. همچنین دو مدل جهت مقایسه پیاده سازی می گردد که نتایج نشان می دهد بالاترین دقت مربوط به درخت تصمیم با روش وزن دهی tfidf و n-gram با مقدار 4 بوده و کمترین دقت مربوط به بیز ساده با روش وزن دهی term frequency و n-gram با مقدار 4 می باشد. مشاهده می شود که درخت تابعی در روش وزن دهی tfidf نتیجه بهتری دارد و با افزایش میزان n-gram دقت نیز افزایش می یابد. برخلاف آن در بیز ساده با افزایش n-gram دقت آن کاهش می یابد.

کلیدواژه ها:

انتخاب ویژگی ، الگوریتم یادگیری ، وزندهی ، دسته بندی خودکار متون

نویسندگان

محمد بهروزیان نژاد

دانشگاه آزاد اسلامی واحد دزفول، باشگاه پژوهشگران جوان و نخبگان، دزفول، ایران

ابراهیم بهروزیان نژاد

دانشگاه آزاد اسلامی واحد شوشتر، باشگاه پژوهشگران جوان و نخبگان، شوشتر، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

Someه [2] S. Kim, K. Han, H. Rim, and S. ...
و نخبگان واحد شوشتر _ اسفند ماه 1392 ...
K.Gayathri and A.Marimuthu, "Text Categorization _ using PDDP with Support ...
M. J. Meena, and K. R. Chandran, "Naive bayes text ...
international conference on Advanced Computing, pp. 28 - 33, 2009. ...
F. Sebastiani, "Machine Learning in Automated Text Categorization _ ACM ...
V. Korde and C. N. Mahender, "TEXT CLAS S IFICATION ...
M. Dash and H. Liu, :Feature selection for classificationf Intelligent ...
J. Sheinvald and B. Dom, "A Modeling Approach to feature ...
Y. Yang, and J. A. Pedersen, _ comparative study on ...
Y. Yang, _ Evaluation of Statistical Approaches to Text Clas ...
Featureء [10] L. Galavotti, S. Fabrizio, and M. Simi, Selection ...
N. Landwehr, M. Hall, E. Frank, "Logistic Model Trees", Machine ...

نمایش کامل مراجع