بررسی چهارچوب مفهومی بازیابی اطلاعات وب

  • سال انتشار: 1399
  • محل انتشار: پنجمین کنفرانس ملی مهندسی کامپیوتر و بلاک چین ایران
  • کد COI اختصاصی: CITCOMP05_023
  • زبان مقاله: فارسی
  • تعداد مشاهده: 998
دانلود فایل این مقاله

نویسندگان

مهدی حبیب زاده خامنه

گروه کامپیوتر، دانشکده مهندسی کامپیوتر، واحد نجف آباد ، دانشگاه آزاد اسلامی، نجف آباد، ایران

حمید رستگاری

استادیار گروه کامپیوتر، دانشگاه اصفهان، نجف آباد، ایران

چکیده

امروزه با گسترش سریع و روزافزون وب سایت ها و ازدیاد کاربران اینترنت، بازیابی اطلاعات از میان حجم انبوهی از اطلاعات بادقت و سرعت مناسب امری بسیار دشوار و در عین حال بسیار مهم می باشد. در بازیابی اطلاعات وب این موضوع حائزاهمیتاست که پرسوجو با آنچه که در خروجی ظاهر میشود چه میزان تطابق و همخوانی داشته باشد تا با بیشترین میزان خواسته هاکاربر را مرتفع سازد. موتور جستجو برای استخراج اطلاعات ارزشمند از اینترنت استفاده می شود. بازیابی اطلاعات علم جستجواطلاعات در یک سند، جستجو برای خود سندها، جستجو برای فراداده ها که داده ها را توصیف می کنند و برای پایگاه داده هایمتنی، عکسی یا آوایی است. سیستم های بازیابی اطلاعات خودکار برای کاهش سرریز داده ها می گویند، استفاده می شوند. سیستمبازیابی اطلاعات نرمافزاری است که دسترسی، ذخیره و مدیریت کتاب ها، مقالات و دیگر سندها را فراهم می کند. منظور از بازیابیاطلاعات وب، به فعالیتی که برای بدست آوردن منابع سیستم اطلاعاتی مربوط به اطلاعات لازم از یک مجموعه است گفته می شود.جستجوها میتوانند برپایه جستجوی تمام متن یا سایر جستجوهای مبتنی بر محتوا نمایه گذاری شوند. در این مقاله، تمرکزاصلی بر روی ارائه یک دیدگاه جامع و منظم در مورد پیشرفت و چالش های جستجوی وب ، تحقیقات و توسعه های انجام شدهدر این زمینه و با هدف معرفی مسائل پیرامون آن پرداخته شده است. بررسی مختصری را در رابطه با موتور جستجو و مرورگروب و متدهای یادگیری ماشین در بازیابی اطلاعات و ارزیابی و دیگر کارهای مرتبط با این موضوع آورده شده است. نتایج بررسینشان می دهد محققین در زمینه های گوناگون از بازیابی اطلاعات وب استفاده کرده اند و به نتایج مطلوب و بهینه ای دست پیدا کرده اند.

کلیدواژه ها

بازیابی اطلاعات وب، موتورهای جستجو، یادگیری ماشین، خزنده وب

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.