ارزیابی کارایی مدلهای دسته بندی خودکار متون
محل انتشار: همایش ملی مهندسی کامپیوتر و فناوری اطلاعات
سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,023
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NCCEB01_101
تاریخ نمایه سازی: 18 خرداد 1393
چکیده مقاله:
دسته بندی خودکار متون به طور کلی به دو بخش اصلی انتخاب ویژگی و الگوریتم یادگیری تقسیم میشود.در ارتباط با تکنیکهای انتخاب ویژگی و الگوریتم های یادگیری، روشهای متنوعی ارائه شده است. هدف در تکنیک های ارائه شده، بالا بردن دقت دسته بندی و رسیدن به کارایی مطلوب میباشد. در این مقاله مهمترین و کاراترین تکنیک های انتخاب ویژگی و نیز الگوریتم هاییادگیری مورد تحلیل و بررسی قرار میگیرند و در نهایت پیشنهاداتی جهت استفاده بهینه تر از این تکنیک ها صورت میگیرد. با توجه به این نکته که هر کدام از روش های ارائه شده در کنار مزایای خود دارای معایبی نیز میباشند، بررسی این تکنیک ها میتواند در ارائه تکنیک های جدید که نقاط ضعف تکنیک های پیشین را پوشش دهد، موثر باشد. همچنین دو مدل جهت مقایسه پیاده سازی می گردد که نتایج نشان می دهد بالاترین دقت مربوط به درخت تصمیم با روش وزن دهی tfidf و n-gram با مقدار 4 بوده و کمترین دقت مربوط به بیز ساده با روش وزن دهی term frequency و n-gram با مقدار 4 می باشد. مشاهده می شود که درخت تابعی در روش وزن دهی tfidf نتیجه بهتری دارد و با افزایش میزان n-gram دقت نیز افزایش می یابد. برخلاف آن در بیز ساده با افزایش n-gram دقت آن کاهش می یابد.
کلیدواژه ها:
نویسندگان
محمد بهروزیان نژاد
دانشگاه آزاد اسلامی واحد دزفول، باشگاه پژوهشگران جوان و نخبگان، دزفول، ایران
ابراهیم بهروزیان نژاد
دانشگاه آزاد اسلامی واحد شوشتر، باشگاه پژوهشگران جوان و نخبگان، شوشتر، ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :