ارائه روشی بر مبنای پیوند جهت بهبود تشخیص صفحات فریب آمیز در گراف وب فارسی

سال انتشار: 1395
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 89

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_JSCIT-5-3_002

تاریخ نمایه سازی: 25 مهر 1403

چکیده مقاله:

امروزهباافزایشچشمگیراستفادهازاینترنتوهمچنینرشدبسیارفزایندهصفحاتوب،استفادهازموتورهای جستجو اهمیتبیشتریپیداکردهاست. درنتیجهبعضیازافرادبرایبدستآوردنمخاطببیشترو افزایش سود ناشی از آن تلاشمی­­کنندموتورهای جستجوراگمراهکنندورتبهصفحاتموردنظرخودراباروش­هاینامشروعبالاببرند.شناساییاینصفحاتمی­تواندنقشیاساسیدربهبودعملکردموتورهایجستجووبالابردناطمینانکاربرانبه آنهاگردد. نظر به اهمیت کشف صفحات وب فریب­آمیز، دراینمقالهروشی جدید بر مبنای اطلاعات پیوندها جهت شناسایی صفحات فریب­آمیز در گراف وب فارسی ارائه می­گردد. در این روش با بهره­گیری از اطلاعات پیوندها، ابتدا توده­های فریب­آمیز شناسایی می­شود و سپس امتیاز منفی آنها در کل گراف انتشار می­یابد. برای بررسی صحت عملکرد الگوریتم ارائه شده،  این روش بر روی داده­های موتور جستجوی فارسی پارسی­جو پیاده­سازی شده است و نتایج ارزیابی­های صورت گرفته بهبودی برابر با ۲۱.۲% را در فاکتور دقت نشان می­دهد. امروزهباافزایشچشمگیراستفادهازاینترنتوهمچنینرشدبسیارفزایندهصفحاتوب،استفادهازموتورهای جستجو اهمیتبیشتریپیداکردهاست. درنتیجهبعضیازافرادبرایبدستآوردنمخاطببیشترو افزایش سود ناشی از آن تلاشمی­­کنندموتورهای جستجوراگمراهکنندورتبهصفحاتموردنظرخودراباروش­هاینامشروعبالاببرند.شناساییاینصفحاتمی­تواندنقشیاساسیدربهبودعملکردموتورهایجستجووبالابردناطمینانکاربرانبه آنهاگردد. نظر به اهمیت کشف صفحات وب فریب­آمیز، دراینمقالهروشی جدید بر مبنای اطلاعات پیوندها جهت شناسایی صفحات فریب­آمیز در گراف وب فارسی ارائه می­گردد. در این روش با بهره­گیری از اطلاعات پیوندها، ابتدا توده­های فریب­آمیز شناسایی می­شود و سپس امتیاز منفی آنها در کل گراف انتشار می­یابد. برای بررسی صحت عملکرد الگوریتم ارائه شده،  این روش بر روی داده­های موتور جستجوی فارسی پارسی­جو پیاده­سازی شده است و نتایج ارزیابی­های صورت گرفته بهبودی برابر با ۲۱.۲% را در فاکتور دقت نشان می­دهد.

نویسندگان

Marzie Parooie

دانشجوی کارشناسی ارشد، دانشکده مهندسی برق و کامپیوتر، دانشگاه یزد،یزد،

- -

دانشیار، دانشکده مهندسی برق و کامپیوتر، دانشگاه یزد، یزد، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • M. Luckner, M. Gad and P. Sobkowiak, "Stable web spam ...
  • A.M. ZarehBidoki, M.A. Golshani, and E. Mousakazemi-Mohammadi ", Design and ...
  • G.-R. Xue, Q. Yang, H.-J. Zeng, Y. Yu, and Z. ...
  • L. Page, S. Brin, R. Motwani, and T. Winograd, "The ...
  • B. Wu and B. D. Davison, "Identifying link farm spam ...
  • شکل ۹: مقایسه نتایج قبل از اعمال الگوریتم شناسایی صفحات ...
  • L. Becchetti, C. Castillo, D. Donato, S. Leonardi and R. ...
  • on Adversarial Information Retrival on the Web (AIRWEB), ۲۰۰۶ ...
  • Z. Gyongyi, H. Garcia-Molina and J. Peddersen, "Combating web spam ...
  • V. Krishnan, R. Raj, "Web spam detection with anti-TrustRank" , ...
  • on Adversarial Information Retrival on the Web (AIRWEB),pp. ۳۷-۴۰, ۲۰۰۶ ...
  • نمایش کامل مراجع