ارائه مدل ترکیبی نوین رتبه بندی در موتورهای حستجو براساس خصوصبت های مبتنی بر متن و پیوند برای تشخیص وب اسیم ها
- سال انتشار: 1402
- محل انتشار: دومین کنفرانس دانشجویان مهندسی کامپیوتر و فناوری اطلاعات و ارتباطات
- کد COI اختصاصی: CICTC02_004
- زبان مقاله: فارسی
- تعداد مشاهده: 210
نویسندگان
مربی، مدرس گروه کامپیوتر دانشگاه امام جواد(ع) یزد
دانشجوی کارشناسی مهندسی کامپیوتر دانشگاه امام جواد (ع) یزد
چکیده
در عصر کنونی حجم اطلاعات مختلف در بستر شبکه اینترنت رشد بسیار زیادی را دارا گردید به گونه ای که بامطرح شدن خرید آنلاین به علت راحتی خرید آنلاین. تبلیغات اینترنتی و همچنین زیاد شدن تعداد وب سایت ها،موتورهای جستجو به منظور رفع نیاز اطلاعاتی کاربران در کم ترین زمان ایجاد می گردند. کاربران برای یافتناطلاعات مورد نظرشان به موتورهای جستجو رجوع کرده و تنها نخستین نتایجی که موتورهای جستجو نمایشمی دهد را مورد بررسی قرار می دهند. از این رو موتورهای جستجو و قرار گرفتن صفحات در نتایج نخست برایصاحبان وب سایت ها حائز اهمیت شد. در این بین افرادی سعی در فریب دادن موتورهای جستجو برای قرار دادنصفحات سایت خود به صورت غیرمنصفانه در نتایج نخست داشته اند. این تلاش ها منجر به ایجاد پدیده وب اسیمگردید. هدف از انجام این پژوهش ارائه مدل ترکیبی نوین رتبه بندی در موتورهای جستجو براساس خصوصیت هایمبتنی بر متن و پیوند برای تشخیص وب اسیم ها این پژوهش به شیوه جمع اوری اطلاعات به شیوه توصیفی انجام گرفت. نتایج نشان می دهد وب اسپم روشی است که با استفاده از آن صفحات نامرتبط در رتبه بندی موتورهای جستجو، رتبه ای بالاتر از صفحات مرتبط خواهند داشت تا کنون پژوهش های زیادی برای تشخیص وب اسپم ها صورت گرفته است. با این حال تا کنون هیچ روشی موثری برای تشخیص تمام صفحات آسپم ارائه نگردیده است. دراین پژوهش با ارائه یک الگوربتم ترکیبی مبتنی بر روش های متن و پیوند ارائه گردیده و تلاش شد انواع صفحاتاسپم موجود در بستر وب. با کارایی بالا شناسایی گردد. رویکرد محتوا محور از تراکم کلمه و همچنین نرخ ضمیمه های نقش دستوری و رویکرد مبتنی بر لینک از PageRank مختص به هر صفحه بهره می گیرد. این روش بر روی داده های WEBSPAM-UK۲۰۰۶ پیاده سازی شده و نتایج ارزیابی های صورت گرفته نشان دهنده مقدار ۷۷.۲% برای معیار F۱ بود.کلیدواژه ها
رتبه بندی، موتورهای جستجو، خصوصیت، مبتنی بر متن و پیوند و وب آسپم هامقالات مرتبط جدید
- یک رویکرد مبتنی بر پردازش زبان طبیعی و مدلهای یادگیری ماشین برای ارزیابی خودکار تکالیف نوشتاری دانش آموزان و ارائه بازخورد به معلمان
- ادغام یادگیری عمیق بیزی برای تشخیص و ارزیابی کیفیت سگمنتیشن سرطان با مدیریت عدم قطعیت
- Comparative Analysis of Automation Ecosystems and Playbooks in Check Point, Palo Alto, Fortinet, and Cisco Firewalls
- چارچوب یکپارچه برای بهینه سازی کارایی و تقویت امنیت سیستم های توزیع شده در محیط های ابری، IoT و Edge
- Uncovering Genetic and Signaling Pathway Alterations in Pompe Disease through Bioinformatics Approaches
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.