متن کاوی توسط تکنیک خوشه بندی K میانگین بهینه شده، با استفاده از ابرداه ها به منظور بدست آوردن اطلاعات بیشتر

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 900

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

COMPUTER04_025

تاریخ نمایه سازی: 21 اردیبهشت 1397

چکیده مقاله:

با توجه به حجم اطلاعات الکترونیکی و آنلاین، دسترسی سریع و صحیح به منابع مهم و مورد علاقه، یکی از دغدغه های استفاده از این منبع اطلاعاتی بسیار بزرگ است. ارایه ابزاهایی که با بررسی متون بتواند تحلیلی روی آنها انجام دهند واژه متن کاوی را مطرح کرده است. متن کاوی روشی برای استخراج دانش از متون و کشف اطلاعات جدید و از پیش ناشناخته، به وسیله استخراج خودکار اطلاعات از منابع مختلف نوشتاری است. دادهکاوی در متن در زمان های مختلف بر اساس کاربرد و روش شناسی مورد استفاده، به صورت پردازش متن آماری، کشف دانش در متن، آنالیز هوشمند متن یا پردازش زبان طبیعی تعیین شده است. دادهکاوی روشی جهت کشف اطلاعات سودمند، جدید و بالقوه از بین حجم انبوهی از اطلاعات میباشد. مهمترین ابزار در دادهکاوی تهیه ابرداده است. ابر دادهها خلاصه توضیحی دادهها و هر نوع اطلاعات توصیفی ساختار یافته درباره دادهها است که به منظور شناسایی، توصیف، مکانیابی و مدیریت منابع به کار میروند. بر همین اساس در پژوهش حاضر به بررسی متن کاوی به منظور بدست آوردن اطلاعات بیشتر بااستفاده از ابردادهها و با تکنیک K میانگین پرداخته شد. در این بررسی به منظور متن کاوی از 53 متن با 7 موضوع مختلف استفاده شد و از هر یک از این متون یک کلید واژه تهیه شد و سپس به وسیله کلید واژه و تعداد تکرار کلمات خوشه بندی انجام گرفت و با استفاده از روش k- means متن کاوش گردید و درنهایت با استفاده از این اطلاعات هر متن به نوع خاصی که پیش از این طبقه بندی شده بود نسبت داده شد. نتایج نهایی حاصل از بررسی کارایی روش k-means را به منظور افزایش استخراج ویژگی های بیشتر از ابرداده ها نشان میدهد

نویسندگان

علی عباسی چالشتری

دانشجوی کارشناسی ارشد مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد شهرکرد

فرشاد کیومرثی

استادیار گروه کامپیوتر، دانشگاه آزاد اسلامی واحد شهرکرد

مرضیه گرامی

عضو هیات علمی گروه کامپیوتر، دانشگاه آزاد اسلامی واحد شهرکرد