طبقه بندی صفحات وب با استفاده از الگوریتم های هوشمند درخت تصمیم جهت بهبود کارایی خزنده های متمرکز

  • سال انتشار: 1393
  • محل انتشار: اولین همایش منطقه ای دستاوردهای نوین در مهندسی کامپیوتر
  • کد COI اختصاصی: NEWCOMPNATANZ01_004
  • زبان مقاله: فارسی
  • تعداد مشاهده: 957
دانلود فایل این مقاله

نویسندگان

مهدیه فاریابی

دانشگاه آزاد اسلامی واحد کرمان

عباس رضایی

دانشگاه آزاد اسلامی واحد کرمان

چکیده

با توجه به موضوعی شدن موتورهای جستجو امروزه پژوهش های زیادی در زمینه بالا بردن دقت تشخیص صفحات وب صورت گرفته است. که اغلب این پژوهش ها Relief و Gini هدفشان ساخت طبقه بند با استفاده از الگوریتم های موجود است. در این پژوهش هدف این است که با استفاده از شاخص های وزن دهی هوشمند بر انتخاب ویژگی های تاثیر گذار جهت ساخت بردار ویژگی تمرکز شود، زمانی که یک خزنده متمرکز بتواند بردار ویژگی مناسبی استخراج نماید مطمئناً دقت تشخیص جهت طبقه C نزدیکترین همسایه و الگوریتم 4.5 K ، طبقه بند در انتخاب موضوع نیز بالا می رود. هدف دیگر این پژوهش استفاده از الگوریتم های هوشمند بیز ساده بندی ویژگی های استخراج شده با دو معیار وزن دهی فوق و مقایسه الگوریتم ها از لحاظ دقت و سرعت طبقه بندی می باشد.

کلیدواژه ها

داده کاوی، وب کاوی، متن کاوی، الگوریتم های هوشمند، شاخص های وزن دهی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.