ارائه مدل ترکیبی نوین رتبه بندی در موتورهای حستجو براساس خصوصبت های مبتنی بر متن و پیوند برای تشخیص وب اسیم ها

  • سال انتشار: 1402
  • محل انتشار: دومین کنفرانس دانشجویان مهندسی کامپیوتر و فناوری اطلاعات و ارتباطات
  • کد COI اختصاصی: CICTC02_004
  • زبان مقاله: فارسی
  • تعداد مشاهده: 177
دانلود فایل این مقاله

نویسندگان

فاطمه دستجردی

مربی، مدرس گروه کامپیوتر دانشگاه امام جواد(ع) یزد

سیدمهدی کوهکن

دانشجوی کارشناسی مهندسی کامپیوتر دانشگاه امام جواد (ع) یزد

چکیده

در عصر کنونی حجم اطلاعات مختلف در بستر شبکه اینترنت رشد بسیار زیادی را دارا گردید به گونه ای که بامطرح شدن خرید آنلاین به علت راحتی خرید آنلاین. تبلیغات اینترنتی و همچنین زیاد شدن تعداد وب سایت ها،موتورهای جستجو به منظور رفع نیاز اطلاعاتی کاربران در کم ترین زمان ایجاد می گردند. کاربران برای یافتناطلاعات مورد نظرشان به موتورهای جستجو رجوع کرده و تنها نخستین نتایجی که موتورهای جستجو نمایشمی دهد را مورد بررسی قرار می دهند. از این رو موتورهای جستجو و قرار گرفتن صفحات در نتایج نخست برایصاحبان وب سایت ها حائز اهمیت شد. در این بین افرادی سعی در فریب دادن موتورهای جستجو برای قرار دادنصفحات سایت خود به صورت غیرمنصفانه در نتایج نخست داشته اند. این تلاش ها منجر به ایجاد پدیده وب اسیمگردید. هدف از انجام این پژوهش ارائه مدل ترکیبی نوین رتبه بندی در موتورهای جستجو براساس خصوصیت هایمبتنی بر متن و پیوند برای تشخیص وب اسیم ها این پژوهش به شیوه جمع اوری اطلاعات به شیوه توصیفی انجام گرفت. نتایج نشان می دهد وب اسپم روشی است که با استفاده از آن صفحات نامرتبط در رتبه بندی موتورهای جستجو، رتبه ای بالاتر از صفحات مرتبط خواهند داشت تا کنون پژوهش های زیادی برای تشخیص وب اسپم ها صورت گرفته است. با این حال تا کنون هیچ روشی موثری برای تشخیص تمام صفحات آسپم ارائه نگردیده است. دراین پژوهش با ارائه یک الگوربتم ترکیبی مبتنی بر روش های متن و پیوند ارائه گردیده و تلاش شد انواع صفحاتاسپم موجود در بستر وب. با کارایی بالا شناسایی گردد. رویکرد محتوا محور از تراکم کلمه و همچنین نرخ ضمیمه های نقش دستوری و رویکرد مبتنی بر لینک از PageRank مختص به هر صفحه بهره می گیرد. این روش بر روی داده های WEBSPAM-UK۲۰۰۶ پیاده سازی شده و نتایج ارزیابی های صورت گرفته نشان دهنده مقدار ۷۷.۲% برای معیار F۱ بود.

کلیدواژه ها

رتبه بندی، موتورهای جستجو، خصوصیت، مبتنی بر متن و پیوند و وب آسپم ها

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.