رویکرد ترکیبی جدید سیبها برای شناسایی هرزنامه های پیچیده در موتورهای جستجو

عباس غلامزاده; مهدی نقوی

رویکرد ترکیبی جدید سیبها برای شناسایی هرزنامه های پیچیده در موتورهای جستجو

محل انتشار: نهمین همایش بین المللی مهندسی فناوری اطلاعات، کامپیوتر و مخابرات ایران

سال انتشار: 1404

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 51

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/2636755

شناسه ملی سند علمی:

ICTBC09_088

تاریخ نمایه سازی: 26 خرداد 1405

چکیده مقاله:

نمایه سازی، هسته اصلی عملکرد موتورهای جستجو است با این حال محتوای هرزنامه و تکراری چالش هایی جدی برای کیفیت نتایج ایجاد می کنند. این مقاله پیاده سازی و ارزیابی یک الگوریتم ترکیبی جدید با نام SiBHA که در آن تحلیل ترکیبی معنایی و رفتاری را برای مقابله با هرزنامه های پیشرفته تولید شده توسط هوش مصنوعی گزارش می دهد. این چارچوب که با استفاده از کتابخانه های PyTorch و PyG پیاده سازی شد، تحلیل عمیق معنایی با استفاده از مدل های ترنسفورمر را با تحلیل الگوهای رفتاری لینک ها از طریق شبکه های عصبی گراف ترکیب می کند. نتایج آزمایش های ما بر روی مجموعه داده استاندارد WEBSPAM-UK۲۰۰۷ و مجموعه داده سفارشی ۲۰۲۵-AI-Spam نشان می دهد که مدل SBHA با دستیابی به امتیاز F۱ برابر با %۹۶.۸، به طور قابل توجهی از مدل های پایه پیشی گرفته و کارایی بالایی در شناسایی هرزنامه های مدرن دارد.

کلیدواژه ها:

تشخیص هرزنامه های مدرن ، موتور جستجو

نویسندگان

عباس غلامزاده

پژوهشگر دانشکده کامپیوتر دانشگاه جامع امام حسین (ع)

مهدی نقوی

استادیار دانشکده کامپیوتر دانشگاه جامع امام حسین (ع)