رویکرد ترکیبی جدید سیبها برای شناسایی هرزنامه های پیچیده در موتورهای جستجو
سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 51
فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICTBC09_088
تاریخ نمایه سازی: 26 خرداد 1405
چکیده مقاله:
نمایه سازی، هسته اصلی عملکرد موتورهای جستجو است با این حال محتوای هرزنامه و تکراری چالش هایی جدی برای کیفیت نتایج ایجاد می کنند. این مقاله پیاده سازی و ارزیابی یک الگوریتم ترکیبی جدید با نام SiBHA که در آن تحلیل ترکیبی معنایی و رفتاری را برای مقابله با هرزنامه های پیشرفته تولید شده توسط هوش مصنوعی گزارش می دهد. این چارچوب که با استفاده از کتابخانه های PyTorch و PyG پیاده سازی شد، تحلیل عمیق معنایی با استفاده از مدل های ترنسفورمر را با تحلیل الگوهای رفتاری لینک ها از طریق شبکه های عصبی گراف ترکیب می کند. نتایج آزمایش های ما بر روی مجموعه داده استاندارد WEBSPAM-UK۲۰۰۷ و مجموعه داده سفارشی ۲۰۲۵-AI-Spam نشان می دهد که مدل SBHA با دستیابی به امتیاز F۱ برابر با %۹۶.۸، به طور قابل توجهی از مدل های پایه پیشی گرفته و کارایی بالایی در شناسایی هرزنامه های مدرن دارد.
کلیدواژه ها:
تشخیص هرزنامه های مدرن ، موتور جستجو
نویسندگان
عباس غلامزاده
پژوهشگر دانشکده کامپیوتر دانشگاه جامع امام حسین (ع)
مهدی نقوی
استادیار دانشکده کامپیوتر دانشگاه جامع امام حسین (ع)