طبقه بندی صفحات وب برای بهینه سازی موتورهای جستجو با استفاده از مدل ترکیبی یادگیری عمیق
محل انتشار: یازدهمین کنفرانس بین المللی وب پژوهی
سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 91
فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
IRANWEB11_019
تاریخ نمایه سازی: 6 خرداد 1404
چکیده مقاله:
در عصر دیجیتال، طبقه بندی دقیق صفحات وب نقشی اساسی در بهینه سازی موتورهای جستجو (SEO) و ارتقای کیفیت بازیابی اطلاعات ایفا می کند. افزایش حجم داده ها و پیچیدگی ساختاری صفحات وب، محدودیت های روش های سنتی مبتنی بر تطابق کلمات کلیدی را آشکار ساخته است. در این پژوهش، یک مدل ترکیبی مبتنی بر شبکه عصبی پیچشی (CNN) و حافظه کوتاه مدت طولانی (LSTM) برای طبقه بندی صفحات وب بر اساس معیارهای سئو ارائه شده است. در این روش، CNN ویژگی های متنی و ساختاری صفحات را استخراج کرده و سپس LSTM روابط معنایی میان واژه ها را تحلیل می کند. برای آموزش و ارزیابی مدل، مجموعه داده های شامل صفحات وب برچسب گذاری شده از منابع معتبر مورد استفاده قرار گرفته است. عملکرد مدل پیشنهادی با استفاده از معیارهای دقت (Accuracy)، صحت (Precision)، یادآوری (Recall) و امتیاز F۱ سنجیده شده است. نتایج نشان می دهد که مدل پیشنهادی به دقت ۹۷.۲۱% دست یافته و نسبت به روش های یادگیری عمیق پیشین، عملکرد بهتری دارد. این یافته ها نشان می دهند که مدل ارائه شده می تواند به عنوان یک ابزار موثر در بهینه سازی رتبه بندی صفحات وب و افزایش کارایی موتورهای جستجو به کار گرفته شود.
کلیدواژه ها:
یادگیری عمیق ، بهینه سازی موتورهای جستجو ، شبکه عصبی پیچشی ، حافظه کوتاه مدت طولانی ، دسته بندی صفحات وب ، تحلیل متن
نویسندگان
مهدی عزیزی سقزچ
دانشجوی کارشناسی ارشد، مهندسی فناوری اطلاعات، واحد یادگار امام خمینی(ره)شهرری، دانشگاه آزاد اسلامی، تهران، ایران
سارا نجف زاده
استادیار گروه کامپیوتر، واحد یادگار امام خمینی(ره)شهرری، دانشگاه آزاد اسلامی، تهران، ایران