بهینه سازی تشخیص هرز صفحات وبی بر اساس الگوریتم بهینه سازحرکت دسته جمعی ذرات

  • سال انتشار: 1394
  • محل انتشار: دومین کنفرانس بین المللی پژوهش در علوم و تکنولوژی
  • کد COI اختصاصی: CRSTCONF02_025
  • زبان مقاله: فارسی
  • تعداد مشاهده: 529
دانلود فایل این مقاله

نویسندگان

مرتضی پولادخای

کارشناسی ارشد مهندسی نرم افزار، مدرس دانشگاه آزاد اسلامی واحد جیرفت

ندا پاینده

کارشناسی ارشد مهندسی نرم افزار، موسسه آموزش عالی جاوید جیرفت

چکیده

هرز صفحات وبی یکی از چالش های اساسی دنیای موتورهای جستجو می باشد که از ابتدای پیدایش موتورهایجستجو با آن همراه بوده است. با توجه به اینکه عملکرد سیستم های بهینهساز جستجو و سیستم های ایجاد هرز صفحه وبی بسیار مشابه می-باشد در نتیجه تشخیص هرز صفحات کار بسیار دشواری بوده و تاکنون هیچ روش مطمئنی برای این موضوع ارائه نشده است. به هر حال معمولاً تکنیک های هرز صفحات وبی برای مغشوشکردن موتور جستجو پیادهسازی خواهند شد بنابراین مطالعه اینکه چگونه به صورت خودکار بر اساس روش های یادگیری ماشین، هرز صفحات وبی را آشکارکنیم، مفید است. در اغلبالگوریتم های آشکارسازی هرز صفحات، تشخیص بر اساس الگوریتم های یادگیری میباشد، یعنی شناسایی هرز صفحات به عنوان یک مسئله طبقهبندی باینری مورد بحث قرار گرفته می شود، به طوریکه هرز صفحات، )هرزنامه یا نرمال( برچسب می- خوردند. دراین مقاله در مورد چگونگی آشکارشدن هرز صفحات وبی توسط الگوریتم بهینهساز مجموعه ذرات بحث میکنیم. درالگوریتم بهینهساز مجموعه ذرات راه حلی برای یک مشکل )یعنی یک تابع تشخیص( به عنوان یک ذره در یک جمعیت ارائه شده است نتایج آزمایشات نشان می دهد که الگوریتم پیشنهادی نسبت به کارهای گذشته مخصوصاً الگوریتم ژنتیک دارای دقت بیشتری بوده و در زمان کمتر به نتیجه خواهد رسید. همچنین این روش پارامترهای کمی برای تنظیم احتیاج دارد

کلیدواژه ها

هرز صفحات وبی، الگوریتم بهینه ساز مجموعه ذرات،رتبه بندی، الگوریتم های یادگیری

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.