ارزیابی ویژگی ها برای تشخیص بازدیدکنندگان مخرب و غیر مخرب وب سایت ها مبتنی بر روش های داده کاوی

  • سال انتشار: 1392
  • محل انتشار: همایش ملی کاربرد سیستم های هوشمند (محاسبات نرم) در علوم و صنایع
  • کد COI اختصاصی: AISST01_142
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1842
دانلود فایل این مقاله

نویسندگان

سوده لایقی

دانشگاه آزاد اسلامی واحد مشهد گروه کامپیوتر نرم افزار

امیرحسین زارعی

دانشگاه آزاد اسلامی واحد مشهد گروه کامپیوتر نرم افزار

مجید وفایی جهان

دانشگاه آزاد اسلامی واحد مشهد گروه کامپیوتر نرم افزار

مهرداد جلالی

دانشگاه آزاد اسلامی واحد مشهد گروه کامپیوتر نرم افزار

چکیده

در این مقاله بازدیدکنندگان وب سایت ها به چهار گروه انسان، روبات وب با رفتار خوب، روبات وب با رفتار مخرب و بازدیدکنندگان ناشناخته تقسیم بندی شده است. روبات های وب یا خزنده های وب برنامه های نرم افزاری هستند که دائماً به صورت خودکار ساختار لینک های وب سایت ها را مورد پیمایش قرار می دهند. هدف روبات های وب کشف و بازیابی محتوا و دانش از وب می باشد. این روبات ها هم به منظور اعمال مفیدی مانند کشف لینک های خراب و هم اعمال مخربی مانند حمله توزیع شده مختل کننده سرویس طراحی شده اند. تشخیص و دسته بندی روبات های وبی که تلاش در تقلید رفتار انسان دارند به عنوان مهم ترین چالش دسته بندی است. در این مقاله برای تشخیص بازدیدکنندگان مخرب و غیر مخرب وب سایت ها سه ویژگی جدید معرفی شده است. ویژگی های بیان شده در مقالات گذشته بعلاوه سه ویژگی جدید با استفاده از روش های شبکه عصبی، ماشین بردار پشتیبان، C4.5، شبکه بیزین و شبکه باور بیزی مقایسه شده است. استخراج ویژگی های جدید برای تشخیص بازدیدکنندگان وب سایت ها باعث شد که دقت دسته بندی در مقایسه با روش های دیگر با ویژگی های کمتر، بهبود یابد و همچنین نشان داده شده است هر چه تعداد مجموعه داده آموزش بیشتر باشد دقت دسته بندی بهتر خواهد بود.

کلیدواژه ها

روبات های وب، روش های داده کاوی، فایل ثبت وقایع، کاربرد کاوی وب

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.