بررسی و تحلیل دادگان تشخیص صفحات اسپم درمحیط وب بر اساس نظریه گراف

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 15

فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CYSP02_053

تاریخ نمایه سازی: 23 تیر 1403

چکیده مقاله:

نظریه گراف که به مدل سازی روابط موجود بین عناصر مختلف مسئله مورد بررسی می پردازد. ابزار مفیدی را برای ساده سازی بخشهای یک سیستم فراهم میکند پیچیده تر شدن مسائل دنیای پیرامونی به کارگیری نظریه گراف را به یک ضرورت تبدیل نموده است. این مقاله قصد دارد مجموعه دادگان عرضه شده به منظور شناسایی تشخیص صفحات اسیم در محیط وب را از منظر گراف مورد بررسی قرار دهد برای این منظور ابتدا گراف شباهت ویژگیهای مجموعه داده ایجاد میشود و سیس گراف حاصل به لحاظ شاخصهای ساختاری مختلف مورد بررسی قرار خواهد گرفت. برای ارزیابی روش پیشنهادی گراف شباهت به ازای دو دسته از ویژگیهای متنی و پیوندی به ارای مجموعه داده WEBSPAM-UK۲۰۰۷ ایجاد گردید و بر اساس شاخصهای فوق مورد مقایسه تحلیلی قرار گرفت. نتایج به دست آمده نشان میدهد که علیرغم بزرگتر بودن و تراکم نسبی بالاتر گراف شباهت ویژگی های مبتنی بر متن نسبت به گراف شباهت ویژگیهای مبتنی بر پیوند بر اساس شاخص های ضریب خوشه بندی گراف شباهت ویژگیهای مبتنی بر پیوند انسجام نسبی بیشتری را دارا می باشد. این موضوع با توجه به اندازه نسبی بزرگترین مولفه همبند نیز تایید میشود. این رویکرد، امکان مقایسه تحلیلی دادگان مختلف را فراهم می آورد. علاوه بر آن میتوان از نتایج این پژوهش به منظور طراحی دادگان جدید نیز استفاده نمود.

کلیدواژه ها:

نظریه گراف دادگان تشخیص صفحات ، اسیم ویژگی های گراف ، شاخص کندال

نویسندگان

مهدیه رعیتی

کارشناسی مهندسی کامپیوتر دانشکده مهندسی دانشکدگان فارابی دانشگاه تهران

امیرحسین کیهانی پور

استادیار گروه مهندسی کامپیوتر دانشکده مهندسی دانشکدگان فارابی دانشگاه تهران