بررسی روشهای هوشمند تشخیص صفحات هرز وب با استفاده از الگوریتم های تکاملی

  • سال انتشار: 1402
  • محل انتشار: اولین همایش ملی نوآوری در مهندسی: راهی به سوی توسعه
  • کد COI اختصاصی: NCIIE01_047
  • زبان مقاله: فارسی
  • تعداد مشاهده: 55
دانلود فایل این مقاله

نویسندگان

علیرضا یلالی

سازمان فناوری اطلاعات و ارتباطات شهرداری اهواز

چکیده

هرزنامه صفحه وب فعالی است که به صورت عمدی توسط انسان صورت پذیرد تا به ناحق جایگاه یک صفحه اینترنتی راتغییر دهد و همچنین میتوان گفت رفتاری است که موجب فریب دادن الگوریتم های موتور جستجو گردد. امروزه باگسترده تر شدن دادگان موجود در فضای مجازی و نیاز همگان به جستجو برای دستیابی به این انبوه اطلاعات، نقشموتورهای جستجو و الگوریتم های مورد استفاده در آنها برای رتبه بندی بسیار اهمیت یافته است. هدف اصلی از هرزصفحات وبی افزایش رتبه کاذب صفحات اینترنتی از طریق فریب الگوریتم های موتورهای جستجو میباشد. هرزنامهصفحات وب یکی از چالشهای اساسی دنیای موتورهای جستجو هست که از ابتدای پیدایش موتورهای جستجو با آنهمراه بوده است. با افزایش گسترش و استفاده از اینترنت، هرزنامه ها و صفحات وب هرزه به عنوان یک مشکل امنیتی واز دست رفتن منابع مهم مورد نگرانی قرار گرفته اند. روشهای هوشمند تشخیص هرز به منظور تشخیص و جلوگیری ازارائه ی محتوای هرز و تقلبی در صفحات وب توسعه داده شدهاند. این روشها شامل استفاده از الگوریتم های یادگیریماشین، تحلیل محتوا، تحلیل شبکه های اجتماعی و بررسی الگوهای مشتریان است. در این مقاله، به تفصیل به بررسیاین روشها پرداخته میشود و نحوه عملکرد آنها، مزایا و معایب هر یک بررسی میشود. هدف اصلی این مقاله، ارائه یکمرور جامع از روشهای هوشمند تشخیص هرز صفحات وب است که میتواند به محققان و متخصصان علاقهمند در زمینهامنیت وب و جلوگیری از هرزنامه ها کمک کند.

کلیدواژه ها

هرزنامه، موتور جستجو، صفحات وب، یادگیری ماشین

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.