متن کاوی در R با بسته tm

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 765

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IDMEC01_068

تاریخ نمایه سازی: 29 بهمن 1398

چکیده مقاله:

بخشی از انقلاب داده های بزرگ مربوط به رشد سریع داده های متنی، صوتی، تصویری و به طور کلی داده های بدون ساختار است. به دلیل رشد روزافزون استفاده از فضاهای مجازی و اینترنت، هر روز با داده هایی سر و کار داریم که اکثرا به شکل متن می باشند. بنابراین سازمان ها و صاحبان کسب و کارهای مختلفی نیاز به راه هایی برای یافتن اطلاعات با ارزش از داده ها و متون سازمان نیافته با استفاده از تکنیک های متن کاوی دارند. از طرفی پژوهش های کیفی مبنی بر تفسیر دادههای حاصل از نتایج مصاحبه ها، روایت های نوشته شده و دیگر متون در حال فراگیر شدن است. در این مقاله به بحث و بررسی پیرامون اهمیت متن کاوی و انجام آن با استفاده از زبان برنامه نویسی R و بسته ی tm که به صورت گسترده در متن کاوی استفاده میشود، پرداخته شد. در نهایت روش ابر کلمات به عنوان یک روش مصور سازی داده های متنی و کاربرد آن در کسب و کارهای نوین مورد بحث قرار گرفت

نویسندگان

سعید آریافر

دانشجوی دکتری آمار دانشگاه شهید باهنر کرمان

علیرضا عربپور

دانشیار بخش آمار دانشگاه شهید باهنر کرمان