وب کاوی کاربران سایت خبری فارسی با استفاده از الگوریتم های قوانین انجمنی

  • سال انتشار: 1394
  • محل انتشار: اولین همایش منطقه ای یافته های جدید کامپیوتری
  • کد COI اختصاصی: FRCNC01_075
  • زبان مقاله: فارسی
  • تعداد مشاهده: 920
دانلود فایل این مقاله

نویسندگان

نجمه تودجی

دانشکده فنی و مهندسی- علوم و تحقیقات یزد

محمدجواد کارگر

دانشکده فنی و مهندسی، دانشگاه علم و هنر ایران- تهران

چکیده

وب جهانی منبع عظیمی از اطلاعات را فراهم آورده است. در بررسیهای گوناگون انجام شده در زمینهی گسترش وب تخمین زده شده است که روزانه بیش از یک میلیون صفحه به وب اضافه میشود. این پدیده که گرانبار شدن اطلاعات نامیده میشود مشکلاتی را برای کاربران وب بوجود آورده است، بنابراین خصوصی سازی فضای اطلاعاتی وب سایت ها تبدیل به یک نیاز شده است.یک روش برای خصوصی سازی داده های وب، استخراجاتوماتیک دانش از روی لاگ وب سایت ها است. تحلیل و آنالیز فایل های بزرگ لاگ وب سایت ها یک عمل پیچیده است. این مقاله کاربرد تکنولوژیداده کاوی در تحلیل رکوردهای لاگ وب سایت ها را نشان می دهد. این فایل های لاگ، از بازدید کاربران از صفحات وب یک سایت خبری فارسی به دست آمده است. سپس با استفاده از تکنیک های داده کاوی و بهره گیری از الگوریتم های قوانین وابستگی الگوهای خواندن وب سایت توسط کاربران استخراج می گردد.این الگوها رفتار کاربران را در بازدید از سایت مشخص می کنند که توسط آن می توان یک سیستم پیشنهاد دهنده خبر را بر اساس سلیقه کاربر، به او ارائه داد

کلیدواژه ها

کاربرد کاوی وب، قوانین انجمنی، خصوصی سازی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.