فیلتر مفهومی صفحات وب با استفاده از آنتولوژیها

  • سال انتشار: 1392
  • محل انتشار: همایش ملی مهندسی کامپیوتر و فناوری اطلاعات
  • کد COI اختصاصی: NCCEB01_062
  • زبان مقاله: فارسی
  • تعداد مشاهده: 537
دانلود فایل این مقاله

نویسندگان

آذین ضرغامی

گروه کامپیوتر دانشگاه آزاد اسلامی واحد دزفول

بیتا شادگار

گروه کامپیوتر دانشگاه شهید چمران اهواز

علیرضا عصاره

گروه کامپیوتر دانشگاه شهید چمران اهواز

چکیده

امروزه حضور اطلاعات در تمامی جوانب زندگی بشر بسیار چشمگیر است و سالهاست که اینترنت به عنوان بستری سهل الوصول برای دسترسی هرچه سریعتر به اطلاعات، تبدیل به ضرورتی انکارناپذیر شده است. نسل اول وب شاهد حضور موتورهای جستجوگری است که عمل جستجوی محتوای مطلوب کاربران را براساس مطابقت لغوی انجام میدهند که سال هاست این نوع جستجو کارایی خود را از دست داده است. با ظهور وب سه، که به وب معنایی معروف است مرورگرها سعی در استفاده از تطابق معنایی و محتوای اطلاعات، به جای تطابق لغوی، جهت یافتن اطلاعات موردنظر نمودند که برای تعیین شباهت اطلاعات از معنا و مفهوم آنها به جای اتکا صرف بر لغات تشکیل دهنده آنها استفاده کردند. این عمل اصطلاحاً فیلتر کردن صفحات وب نامیده میشود. در این مقاله جهت بررسی شباهت های معنایی از پایگاه های دانش مخصوص این حیطه که به آنتولوژی معروف هستند استفاده میشود. در این مقاله یک سیستم فیلتر محتوای وب مبتنی بر آنتولوژی وردنت ارائه شده که از تکنیک های یادگیری ماشین جهت دسته بندی استفاده میکند. نتایج بدست آمده نشان از برتری کیفیت روش پیشنهادی نسبت به روشهای مشابه پیشین دارد.

کلیدواژه ها

فیلتر، شباهتهای معنایی، آنتولوژی، دسته بندی، یادگیری ماشین

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.