CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

دسته بندی متون فارسی با Naïve Bayes

عنوان مقاله: دسته بندی متون فارسی با Naïve Bayes
شناسه ملی مقاله: ITCC02_164
منتشر شده در دومین کنفرانس بین المللی و سومین همایش ملی کاربرد فناوری های نوین در علوم مهندسی در سال 1394
مشخصات نویسندگان مقاله:

شهریار زارع زاد - گروه کامپیوتر، واحد علوم و تحقیقات آذربایجان شرقی، دانشگاه آزاد اسلامی، تبریز، ایران - گروه کامپیوتر، واحد تبریز، دانشگاه آزاد اسلامی، تبریز، ایران
احمد حبیبی زادنوین - گروه کامپیوتر، واحد علوم و تحقیقات آذربایجان شرقی، دانشگاه آزاد اسلامی، تبریز، ایران - گروه کامپیوتر، واحد تبریز، دانشگاه آزاد اسلامی، تبریز، ایران
نیما جعفری زادنوین - گروه کامپیوتر، واحد علوم و تحقیقات آذربایجان شرقی، دانشگاه آزاد اسلامی، تبریز، ایران - گروه کامپیوتر، واحد تبریز، دانشگاه آزاد اسلامی، تبریز، ایران

خلاصه مقاله:
در چند سال اخیر الگوریتم های زیادی برای مساله دسته بندی اسناد، پیشنهاد شده است. اغلب کارهای انجام شده برروی اسناد به زبان انگلیسی بوده و اخیرا در مورد زبان هایی مثل چینی و عربی کارهایی انجام شده است. در این مقالهیک دسته بندی کننده اسناد فارسی با استفاده از روش نیو بیز پیشنهاد شده است و دلیل استفاده از این الگوریتم موفقیت زیاد آن در دسته بندی اسناد مشابه در زبان انگلیسی بوده است این دسته بند بوسیله متون فارسی پیکره همشهری 2 موردآزمایش قرار داده شد. در این آزمایش 6 دسته مختلف از پیکره انتخاب شده بود که در این میان، برای دسته هایهنری، مذهبی، ورزشی و علمی دقت و بازخوانی یک بدست آمد که بهترین عملکرد ممکن می باشد و برای دستهپزشکی دقت 0.917 و بازخوانی یک و برای دسته رایانه بازخوانی 0.9 و دقت 1 بدست آمد.

کلمات کلیدی:
دسته بندی، متون فارسی، نیوبیز

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/501792/