یک رویکرد مبتنی بر اتاماتای یادگیر برای بهبود رتبه بندی نتایج ابرجستجوگر

  • سال انتشار: 1404
  • محل انتشار: یازدهمین کنفرانس بین المللی مهندسی برق، کامپیوتر و مکانیک
  • کد COI اختصاصی: ICPCONF11_196
  • زبان مقاله: فارسی
  • تعداد مشاهده: 16
دانلود فایل این مقاله

نویسندگان

محسن نادری

کارشناس ارشد مهندسی کامپیوتر(نرم افزار)

لیلی عبدی

کارشناس طراحی دوخت و لباس

محیا داغینه

کارشناس ارشد مهندسی کامپیوتر(نرم افزار)

چکیده

دنیای امروز دنیای اطلاعات است و سریع ترین راه انتقال اطلاعات استفاده از فضای وب می باشد. با وجود آن که پیدایش وب موجب تحول شگرفی در فراگیری اخبار و اطلاعات علمی می باشد و از طرفی افزایش زیاد حجم اطلاعات در جهان وب، مشکل یافتن اطلاعات ارزشمند و معتبر را از میان میلیون ها صفحه اطلاعاتی را به دنبال داشته است. به همین دلیل امروزه مسئله بازیابی اطلاعات از مهم ترین مباحث مورد توجه در حوزه مطالعات فضای وب است. برای حل این مسئله ابزارهای مختلفی به وجود آمده است. از آنجایی که هر موتور جستجوی منفرد، فقط می تواند به کمتر از ۱۶ درصد از کل اطلاعات وب دست یابد و هر کدام از آنها مقیاس های متفاوتی را تحت پوشش قرار می دهد، ترکیب چند موتور جستجو منجر به نرخ فراخوانی بیشتری می گردد که حداقل از به کارگیری یک موتور جستجو بهتر است. از این رو یکی از کارآمدترین ابزار بازیابی اطلاعات ابر جستجوگرها می باشند. در این پژوهش یک روش مبتنی بر اتوماتای یادگیر جهت بهبود فرایند رتبه بندی ابر جستجوگر Ez۲Find پیشنهاد شده است. همچنین، در این پژوهش یک پارسر طرحی و پیاده سازی شده است که به صورت آنلاین اقدام به استخراج ۸ معیار مختلف از صفحات وب می نماید. در روش پیشنهادی از این پارسر جهت استخراج معیارهای هشت گانه و ارسال نتایج به بخش اتوماتای یادگیر استفاده شده است. در بخش اتوماتای یادگیر بر اساس این معیارهای هشت گانه اقدام به رتبه بندی صفحات وب می شود و در نهایت صفحات با رتبه بالا به کاربر ارائه می شود. برای پیاده سازی روش پیشنهادی از زبان JAVA و MATLAB استفاده شده است.

کلیدواژه ها

دستیابی به اطلاعات, رتبه بندی صفحات وب, ابر جستجوگر, اتوماتای یادگیر, یازدهمین کنفرانس بین المللی مهندسی برق, کامپیوترومکانیک

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.