ارائه مدل ترکیبی نوین رتبه بندی در موتورهای حستجو براساس خصوصبت های مبتنی بر متن و پیوند برای تشخیص وب اسیم ها
- سال انتشار: 1402
- محل انتشار: دومین کنفرانس دانشجویان مهندسی کامپیوتر و فناوری اطلاعات و ارتباطات
- کد COI اختصاصی: CICTC02_004
- زبان مقاله: فارسی
- تعداد مشاهده: 177
نویسندگان
مربی، مدرس گروه کامپیوتر دانشگاه امام جواد(ع) یزد
دانشجوی کارشناسی مهندسی کامپیوتر دانشگاه امام جواد (ع) یزد
چکیده
در عصر کنونی حجم اطلاعات مختلف در بستر شبکه اینترنت رشد بسیار زیادی را دارا گردید به گونه ای که بامطرح شدن خرید آنلاین به علت راحتی خرید آنلاین. تبلیغات اینترنتی و همچنین زیاد شدن تعداد وب سایت ها،موتورهای جستجو به منظور رفع نیاز اطلاعاتی کاربران در کم ترین زمان ایجاد می گردند. کاربران برای یافتناطلاعات مورد نظرشان به موتورهای جستجو رجوع کرده و تنها نخستین نتایجی که موتورهای جستجو نمایشمی دهد را مورد بررسی قرار می دهند. از این رو موتورهای جستجو و قرار گرفتن صفحات در نتایج نخست برایصاحبان وب سایت ها حائز اهمیت شد. در این بین افرادی سعی در فریب دادن موتورهای جستجو برای قرار دادنصفحات سایت خود به صورت غیرمنصفانه در نتایج نخست داشته اند. این تلاش ها منجر به ایجاد پدیده وب اسیمگردید. هدف از انجام این پژوهش ارائه مدل ترکیبی نوین رتبه بندی در موتورهای جستجو براساس خصوصیت هایمبتنی بر متن و پیوند برای تشخیص وب اسیم ها این پژوهش به شیوه جمع اوری اطلاعات به شیوه توصیفی انجام گرفت. نتایج نشان می دهد وب اسپم روشی است که با استفاده از آن صفحات نامرتبط در رتبه بندی موتورهای جستجو، رتبه ای بالاتر از صفحات مرتبط خواهند داشت تا کنون پژوهش های زیادی برای تشخیص وب اسپم ها صورت گرفته است. با این حال تا کنون هیچ روشی موثری برای تشخیص تمام صفحات آسپم ارائه نگردیده است. دراین پژوهش با ارائه یک الگوربتم ترکیبی مبتنی بر روش های متن و پیوند ارائه گردیده و تلاش شد انواع صفحاتاسپم موجود در بستر وب. با کارایی بالا شناسایی گردد. رویکرد محتوا محور از تراکم کلمه و همچنین نرخ ضمیمه های نقش دستوری و رویکرد مبتنی بر لینک از PageRank مختص به هر صفحه بهره می گیرد. این روش بر روی داده های WEBSPAM-UK۲۰۰۶ پیاده سازی شده و نتایج ارزیابی های صورت گرفته نشان دهنده مقدار ۷۷.۲% برای معیار F۱ بود.کلیدواژه ها
رتبه بندی، موتورهای جستجو، خصوصیت، مبتنی بر متن و پیوند و وب آسپم هامقالات مرتبط جدید
- تحلیل چالشها و راهکارهای تقویت ارتباط دانشگاه و صنعت: با تمرکز بر حلقههای مفقوده
- بازخوانی نقش دانشگاه و صنعت در توسعه ملی: از موانع تا راهکارها
- نشانگر تشخیصی جدید در ژن C-myc به عنوان کیت غیر تهاجمی تشخیص سرطان دهان
- برنامه ریزی منابع تجدید پذیر با درنظر گرفتن برنامه ریزی توسعه انتقال و تولید منابع توان راکتیو
- برنامه ریزی همزمان توسعه انتقال و منابع تولید توان راکتیو با استفاده از یک الگوریتم تکاملی بهبود یافته
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.