فیلترینگ صفحات وب با استفاده از تجزیه محتوا و ساختار
محل انتشار: شانزدهمین کنفرانس دانشجویی مهندسی برق ایران
سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 919
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ISCEE16_381
تاریخ نمایه سازی: 21 تیر 1393
چکیده مقاله:
با رشد توسعه وب، جستجوی مطالب مرتبط با نیازها با استفاده از موتورهای جستجوی سنتی مشکل تر می شود. ما یک دیدگاه آموزش ماشین – محور را پیشنهاد می کنیم که تجزیه محتوا و ساختار وب را با یکدیگر ترکیب می کند. هر صفحه وب را به وسیله مجموعه ای از ویژگی های محتوا – محور و لینک – محور نمایش می دهیم که به عنوان ورودی برای الگوریتم های یادگیری ماشین مختلف بکار می رود. دیدگاه پیشنهادی با استفاده از یک شبکه عصبی بازخورد / پس انتشار و یک ماشین بردار پشتیبان طراحی شد تا این دیدگاه را با دو روش موجود در فیلترینگ صفحه وب یعنی دیدگاه کلمه کلیدی – محور و واژه – محور مقایسه نماید. نتایج آزمایش نشان داد که دیدگاه پیشنهادی در حالت کلی به ویژه زمانی که تعداد اسناد آموزشی کم باشد بهتر عمل می کند. دیدگاه پیشنهادی را می توان در توسعه موتورهای جستجوی مخصوص موضوع و سایر کاربردهای وب نظیر مدیریت محتوای وب بکار برد.
کلیدواژه ها:
نویسندگان