CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

استفاده از تکنیک های متن کاوی برای دسته بندی متون فارسی با مجموعه داده همشهری

عنوان مقاله: استفاده از تکنیک های متن کاوی برای دسته بندی متون فارسی با مجموعه داده همشهری
شناسه ملی مقاله: CEAE01_091
منتشر شده در کنفرانس بین المللی مهندسی، هنر و محیط زیست در سال 1393
مشخصات نویسندگان مقاله:

سیدمحسن هاشمی - موسسه آموزش عالی رهنما، گروه کامپیوتر اهواز، خوزستان، ایران
زکیه درفشان - موسسه آموزش عالی رهنما، گروه کامپیوتر اهواز، خوزستان، ایران
صدیقه جوادی - موسسه آموزش عالی رهنما، گروه کامپیوتر اهواز، خوزستان، ایران
محمد مولازاده دزفولی - موسسه آموزش عالی کارون، گروه کامپیوتر اهواز، خوزستان، ایران

خلاصه مقاله:
بسیاری از اطلاعات و منابع از طریق اینترنت میسر شده است. دسترسی به این اطلاعات حجیم کار بسیارمشکل و هزینه بر است.گاهی از این اطلاعات نامرتبط به خواسته های ما هستند. روش هایی در خصوص متن کاوی بوجود آمده اند که می توانند کار را برای ما آسانتر کنند ولی تاکنون روشهای انجام شده بر روی منابع لاتین بوده اند در این مقاله از روش های متن کاوی برای دسته بندی متون فارسی استفاده خواهیم نمود. در این مقاله با به کارگیری الگوریتم های یادگیری بیز کارایی دسته بندی را با مجموعه داده همشهری با 07 درصد آموزش و 37 درصد آزمایش مورد بررسی قرار داده ایم. نتایح کارایی به 84.48 درصد و خطای 14.42 درصد رسانیده ایم.

کلمات کلیدی:
متن، متن کاوی، اسناد، دسته بندی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/372406/