وب گردی: وضعیت هنر، تکنیکها، رویکردها و کاربردها
- سال انتشار: 1403
- محل انتشار: پنجمین همایش بین المللی دستاوردهای نوین در فناوری اطلاعات، علوم کامپیوتر، امنیت، شبکه و هوش مصنوعی
- کد COI اختصاصی: INDEXCONF05_027
- زبان مقاله: فارسی
- تعداد مشاهده: 67
نویسندگان
sa.lajevardi@cuir.ac.ir
چکیده
وب گردی یا خزیدن وب، فرآیند استخراج خودکار دادهها از وب سایتها با استفاده از نرمافزار است این فرآیند امروزه در زمینه هایی مانند هوش تجاری، علوم داده، و امنیت سایبری بسیار حیاتی است وب گردی امکان استخراج دادههای ساختاریافته از صفحات وب را فراهم میکند، حتی زمانی که این دادهها در قالب های قابل خواندن توسط ماشین مانند JSON یا XML در دسترس نباشند این مقاله به بررسی تعریف، عملکرد، مراحل، فناوریها و ارتباط وب گردی با حوزههایی مانند هوش تجاری، هوش مصنوعی، علوم داده، کلان داده و امنیت سایبری میپردازد همچنین، چگونگی انجاموب گردیبا استفاده از زبان پایتون، مزایای اصلی آن، چشماندازها ی آینده و ملاحظات اخلاقی و قانونی مرتبط با آن مورد بحث قرار میگیرد،وب گردییا خزیدن وب، فرآیند استخراج خودکار دادهها از وب سایتها با استفاده از پروتکل HTTP است این فرآیند میتواند به صورت دستی یا خودکار با استفاده از خزندههای وب انجام شودوب گردییکی از ابزارهای ارزشمند برای دانشمندان داده است، ز یرا امکان استخراج حجم عظیمی از دادهها را با هز ینه نسبتا کم فراهم میکند این مقاله به بررسی مفاهیم، تکنیکها و ابزارهایوب گردیمیپردازد و نقش آن را در حوزههایی مانند هوش تجاری، علوم داده و امنیت سایبری تحلیل میکند.کلیدواژه ها
وبگردی, خزیدن وب, زبان پایتون, هوش تجاری, علوم داده, هوش مصنوعی, کلان داده, رایانش ابری, امنیت سایبری, مسائل حقوقی, مسائل اخلاقی, کارایی محاسباتی, طراحی و تحلیل الگوریتم, خزیدن و خراشیدن وب, مدل شیء سند ( DOM)مقالات مرتبط جدید
- NSO: Natural Selection Optimization for Adaptive k-Nearest Neighbor Imputation
- Statistical Model for Determining Maximum Stress in Coronary Vessel Walls caused by Palmaz-Schatz Stent
- Comparison of CNN, LSTM and Their Hybrid Models in Detecting Coronavirus Using Genome Sequences
- Low-light Image Enhancement Using Deep Neural Network: An Improvement on ZeroDCE++
- Stuctered Light ۳D Reconstruction by Charuco
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.