بررسی معماری سیستم های متن کاوی

سال انتشار: 1401
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 418

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CECCONF15_008

تاریخ نمایه سازی: 9 خرداد 1401

چکیده مقاله:

متن کاوی اصطلاحی است که به فرایند تحلیل و کاوش متن، نسبت داده می شود.داده ها انواع مختلفی دارند. برخی به شکل اعداد، تصویر، صوت و برخی هم به صورت متن هستند. طبق گزارشی ۸۰ درصد داده های موجود در سراسر دنیا به صورت متن هستند. هر روز که شما متنی را می نویسیم و در دنیای وب منتشرش می کنیم، در واقع به داده های موجود داده ای دیگر اضافه می کنیم. در نتیجه حجم داده های موجود در وب روز به روز در حال افزایش است. ذخیره سازی، پردازش و تحلیل این حجم از اطلاعات تبدیل به چالشی شده است. سازمان های مختلفی وجود دارند که داده های متنی بسیاری را تولید می کنند.با تکنیک های متن کاوی می توانید داده های متنی را بررسی و تحلیل کنیم و از نتایج حاصل از این تحلیل اطلاعات ارزشمندی کسب نماییم. در واقع داده های متنی هیچ گونه ارزشی ندارند مگر اینکه متن کاوی شوند. متن کاوی به شناسایی الگوها، کلمات کلیدی، موضوعات و دیگر ویژگی های موجود در متن می پردازد. در این مقاله قصد داریم معماری سیستم های متن کاوی را به طور دقیق بررسی کنیم.

نویسندگان

علی سرآبادانی

دانشجوی دکترای مهندسی فناوری اطلاعات (IT) دانشگاه قم

مصطفی حاتمی کاسوایی

کارشناسی ارشد مهندسی کامپیوتر دانشگاه صنعتی مالک اشتر