آشنایی با روش های رفع اطلاعات نویزی در صفحات وب برای داده کاوی

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 516

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CEITCONF01_127

تاریخ نمایه سازی: 26 مرداد 1397

چکیده مقاله:

یک صفحه وب تجاری معمولا حاوی اطلاعات زیادی است بلوک هایی به غیر از بلوک های محتوااصلی، معمولا چنین است بلوک هایی چون پانل های ناوبری، اطلاعیه های کپی رایت و حریم خصوصی، و تبلیغات (برای اهداف کسب و کار و برای دسترسی آسان به کاربران). ما این بلوک ها را که بلوک های اصلی محتوا نیستند بلوک های پر سر و صدا می نامیم. ما نشان می دهیم که اطلاعات موجود در این بلوک های پر سر و صدا می تواند به طور جدی به وب کاوی آسیب بزنند و از بین بردن این سر و صدا از اهمیت زیادی برخوردار است.دراین با روش هایی برای حذف این داده ها آشنا می شویم و هدف آشنایی مختصری با برخی مفاهیم داده کاوی خوشه بندی و طبقه بندی داده ها می باشد.

کلیدواژه ها:

نویسندگان

فاطمه تنهایی ادیمی

دانشجوی کارشناسی ارشد مهندسی کامپیوتر نرم افزار، موسسه ی آموزش عالی هاتف زاهدان

سمانه زرگری

دانشجوی کارشناسی ارشد مهندسی کامپیوتر نرم افزار، موسسه ی آموزش عالی هاتف زاهدان