مقایسه و ارزیابی روش های دسته بندی متون فارسی

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 673

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

BPJ03_110

تاریخ نمایه سازی: 29 مهر 1396

چکیده مقاله:

امروزه با توجه به افزایش اسناد متنی در محیط های دیجیتال خصوصا در حوزه وب، نیاز به روش های کنترل و مدیریت اسناد بیش از پیش احساس می شود. یکی از کلیدی ترین روش های مدیرت بر متون دیجیتال، متن کاوی است. دسته بندی متون که از زیر شاخه های متن کاوی است می تواند در این مهم نقش شایانی ایفا کند.طبقه بندی و یا دسته بندی متون، وظیفه انتساب اسناد به یکی از دسته های از پیش تعین شده را بر عهده دارد. این موضوع در سال های اخیر توجه زیادی را به خود جلب کرده و روش ها و الگوریتم های زیادی در این باره ابداع شده است. در این مقاله با ذکر الگوریتم های موجود به شرح و بررسی روش های دسته بندی می پردازیم و در نهایت با تمرکز بر روی اسناد فارسی بر اساس پارامترهای استاندارد ارزیابی کاراترین روش را بر اساس تحقیقات انجام گرفته معرفی می کنیم .هدف از انجام این پژوهش معرفی بهترین روش های دسته بندی در متون فارسی است تا کمکی باشد به پژوهشگران این حوزه در انتخاب روش و الگوریتم دسته بندی خودکار متون فارسی.

نویسندگان

اصغر کریمی

عضو هیات علمی موسسه آموزش عالی جهاد دانشگاهی اصفهان، ایران

حمیدرضا صدرارحامی

دانشجوی دکتری مهندسی کامپیوتر دانشگاه آزاد اسلامی واحد نجف آباد، اصفهان، ایران