CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

فیلترینگ صفحات وب با استفاده از تجزیه محتوا و ساختار

عنوان مقاله: فیلترینگ صفحات وب با استفاده از تجزیه محتوا و ساختار
شناسه ملی مقاله: NCCIT01_007
منتشر شده در همایش ملی کامپیوتر و فناوری اطلاعات در سال 1390
مشخصات نویسندگان مقاله:

نسرین احمدی - کارشناسی ارشد مهندسی نرم افزار کامپیوتر

خلاصه مقاله:
با رشد توسعه وب جستجوی مطالب مرتبط با نیازها با استفاده ازموتورهای جستجوی سنتی مشکل تر می شود ما یک دیدگاه آموزش ماشین محور را پیشنهاد می کنیم که تجزیه محتوا و ساخترا وب را با یکدیگر ترکیب می کند هرصفحه وب را بوسیله مجموعه ای از ویژگیهای محتوا - محور و لینک محور نمایش می دهیم که به عنوان ورودی برای الگوریت م های یادگیری ماشین مختلف بکارمیرود دیدگاه پیشنهادی با استفاده از یک شبکه عصبی بازخورد / پس انتشار و یک ماشین بردار پشتیبان طراحی شده تا این دیدگاه را با دو روش موجود در فیلترینگ صفحه وب یعنی دیدگاه کلمه کلیدی - محور و واژه محور مقایسه نماید نتایج آزمایش نشان داد کهدیدگاه پیشنهادی در حالت کلی به ویژه زمانی که تعداد اسناد آموزشی کم باشد بهتر عمل می کند دیدگاه پیشنهادی را می توان درتوسعه موتورهای جستجوی مخصوص موضوع و سایر کاربردهای وب نظیر مدیریت محتوای وب بکاربرد.

کلمات کلیدی:
دسته بندی صفحات وب، تجزیه لینک، یادگیری ماشین ، وبکاوی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/141955/