بهبود کیفیت و سرعت خوشه بندی صفحات وب با استفاده از نگاشت-کاهش

  • سال انتشار: 1396
  • محل انتشار: اولین کنفرانس ملی اصول مهندسی برق و کامپیوتر
  • کد COI اختصاصی: PECCON01_058
  • زبان مقاله: فارسی
  • تعداد مشاهده: 421
دانلود فایل این مقاله

نویسندگان

آرش پیک

گروه کامپیوتر، دانشگاه بین المللی امام رضا(ع) مشهد، ایران

عادل قاضی خانی

گروه کامپیوتر، دانشگاه بین المللی امام رضا(ع) مشهد، ایران

چکیده

امروزه حجم گسترده صفحات وب که معمولا به صورت خوشه بندی نشده هستند و پراکندگی و تنوع لغات درون صفحات وب که در نتیجه آن ،ایجاد داده هایی در فضای با ابعاد بالا هست، استفاده از الگوریتم های قدیمی خوشه بندی را با چالش هایی از قبیل کاهش سرعت خوشه بندی به دلیل ابعاد بالا و تعداد زیاد صفحات وب، کاهش کیفیت خوشه بندی به دلیل وجود لغات زاید و بی معنی و یا نامرتبط با محتوا و موضوع اصلی صفحه درون صفحات وب و یا چالش ایجاد خوشه هایی متفاوت اما با معنای یکسان محتوا مواجه کرده است. در روش پیشنهادی، با استفاده از نگاشت کاهشت، در دو مرحله از خوشه بندی، سرعت را افزایش می دهیم و با کمک حذف کلمات کم اهمیت و خلاصه سازی صفحات وب و در نتیجه کاهش ابعاد صفحات وب، کیفیت خوشه بندی را نیز افزایش می دهیم.

کلیدواژه ها

خوشه بندی صفحات وب، نگاشت کاهش،

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.