فیلترینگ صفحات وب با استفاده از تجزیه محتوا و ساختار
- سال انتشار: 1390
- محل انتشار: همایش ملی کامپیوتر و فناوری اطلاعات
- کد COI اختصاصی: NCCIT01_007
- زبان مقاله: فارسی
- تعداد مشاهده: 1552
نویسندگان
کارشناسی ارشد مهندسی نرم افزار کامپیوتر
چکیده
با رشد توسعه وب جستجوی مطالب مرتبط با نیازها با استفاده ازموتورهای جستجوی سنتی مشکل تر می شود ما یک دیدگاه آموزش ماشین محور را پیشنهاد می کنیم که تجزیه محتوا و ساخترا وب را با یکدیگر ترکیب می کند هرصفحه وب را بوسیله مجموعه ای از ویژگیهای محتوا - محور و لینک محور نمایش می دهیم که به عنوان ورودی برای الگوریت م های یادگیری ماشین مختلف بکارمیرود دیدگاه پیشنهادی با استفاده از یک شبکه عصبی بازخورد / پس انتشار و یک ماشین بردار پشتیبان طراحی شده تا این دیدگاه را با دو روش موجود در فیلترینگ صفحه وب یعنی دیدگاه کلمه کلیدی - محور و واژه محور مقایسه نماید نتایج آزمایش نشان داد کهدیدگاه پیشنهادی در حالت کلی به ویژه زمانی که تعداد اسناد آموزشی کم باشد بهتر عمل می کند دیدگاه پیشنهادی را می توان درتوسعه موتورهای جستجوی مخصوص موضوع و سایر کاربردهای وب نظیر مدیریت محتوای وب بکاربرد.کلیدواژه ها
دسته بندی صفحات وب، تجزیه لینک، یادگیری ماشین ، وبکاویمقالات مرتبط جدید
- بررسی اجمالی اینترنت اشیاء و مشکلات امنیتی آن
- نقش فرماندهی و کنترل و سامانه های آن در نبرد های آینده
- نقش فناوری های بدون سرنشین در عملیات جنگ نوین
- نقش زیرساخت های نظامی سایبری در کنترل میدان جنگ (اقدامات الکترومغناطیسی سایبری)
- طراحی و شبیه سازی دروازه منطقی تمام نوری AND مبتنی بر بلور فوتونی با ابعاد کم و مناسب برای مدارهای مجتمع نوری
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.