مروری بر طبقه بندی و ابزارهای وب کاوی

  • سال انتشار: 1402
  • محل انتشار: ششمین همایش ملی فناوریهای نوین در مهندسی برق، کامپیوتر و مکانیک ایران
  • کد COI اختصاصی: STCONF06_201
  • زبان مقاله: فارسی
  • تعداد مشاهده: 137
دانلود فایل این مقاله

نویسندگان

حجت آزادروش

دانشجوی کارشناسی ارشد مهندسی کامپیوتر ، واحد مشهد ، دانشگاه آزاد اسلامی ، مشهد ، ایرا ن

رضا شیبانی

گروه مهندسی کامپیوتر ، واحد مشهد ، دانشگاه آزاد اسلامی ، مشهد ، ایرا ن

چکیده

وب جهانی منبع عظیمی از داده است که از محتوای وب، که توسط میلیاردها صفحه در دسترس عموم نمایش داده می شود، یا با استفاده از وب که توسط اطلاعات گزارشی که روزانه توسط همه سرورهای وب در اطراف جهان جمع آوری می شود، به دست می آید. از این رو، به دلیل رشد گسترده منابع اطلاعاتی موجود در وب جهانی ، نیاز روزافزونی برای کاربران وب به استفاده از ابزارهای خودکار برای یافتن اطلاعات مورد نظر وجود دارد. وب کاوی یکی از تکنیک های محبوب داده کاوی است که برای کشف و استخراج اطلاعات مفید از اسناد وب و خدمات آن استفاده می شود ، همچنین وب کاوی به عنوان یک رویکرد برجسته برای کشف رابطه بین اسناد وب عمل می کند. کاوش محتوای وب ، کاوش ساختار وب و کاوش محتوای وب ، سه دسته مختلف از کاوی وب هستند. هر یک از این دسته ها الگوریتم ها ، ابزارها و رویکردهای مختلفی برای استخراج دادهها از حجم اطلاعات روی وب دارند . در این مقاله مروری بر نمای کلی و طبقه بندی وب کاوی و مطالعه تطبیقی تکنیک های اخیر وب کاوی ارائه می گردد. همچنین انواع وب کاوی و ابزارهای مورد استفاده در فرآیند وب کاوی نیز مورد بررسی قرار گرفته است

کلیدواژه ها

وب کاوی ، کاوش محتوای وب ، کاوش ساختار وب ، کاوش استفاده از وب

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.