CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارزیابی و مقایسه مناسب ترین الگوریتم های متن کاوی :مطالعه موردی مجموعه داده روزنامه همشهری

عنوان مقاله: ارزیابی و مقایسه مناسب ترین الگوریتم های متن کاوی :مطالعه موردی مجموعه داده روزنامه همشهری
شناسه ملی مقاله: ICESCON04_241
منتشر شده در چهارمین کنفرانس بین المللی علوم و مهندسی در سال 1395
مشخصات نویسندگان مقاله:

غزاله برون - دانشجوی کارشناسی ارشد مهندسی کامپیوتر، نرم افزار، دانشگاه آزاد اسلامی واحد یاسوج
فرهاد راد - عضو هیئت علمی دانشگاه آزاد اسلامی واحد یاسوج
حمید پروین - عضو هیئت علمی دانشگاه آزاد اسلامی واحد بهبهان

خلاصه مقاله:
بسیاری از اطلاعات و منابع از طریق اینترنت میسر شده است. دسترسی به این اطلاعات حجیم کاربسیارمشکل و هزینه بر است.گاهی این اطلاعات نامرتبط به خواسته های ما هستند. روش هایی درخصوص متن کاوی بوجود آمده اند که می توانند کار را برای ما آسانتر کنند ولی تاکنون روش های انجام شده بر روی منابع لاتین بوده اند. امروزه با افزایش روز افزون حجم اطلاعات متنی، وجود روش های طبقه بندی متون ضروری به نظر می رسد. همچنین با رشد فزاینده ی منابع متنی فارسی این مهم بیشتر احساس می شود. در این تحقیق از روش های متن کاوی برای دسته بندی متون فارسی استفاده نموده ایم. لذا با ترکیب الگوریتم ماشین بردار پیشتیبان و الگوریتم بهینه سازی ازدحام ذرات کارایی دسته بندی را در مجموعه داده همشهری با 07 درصد آموزش و 30 درصد آزمایش مورد بررسی قراردادیم. که در بهترین وضعیت نتایح کارایی به 94.74 درصد و خطای 5.26درصد رسیده است. که نسبت به تحقیقات مشابه از دقت قابل توجهی برخوردار می باشد.

کلمات کلیدی:
متن کاوی، درخت تصمیم، بیز ، ماشین بردار پشتیبان ، بگینگ، چاید

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/539107/