بررسی الگوریتم های خوشه بندی و ارائه الگوریتمی جهت خوشه بندی اسناد XML

  • سال انتشار: 1393
  • محل انتشار: اولین همایش منطقه ای دستاوردهای نوین در مهندسی کامپیوتر
  • کد COI اختصاصی: NEWCOMPNATANZ01_010
  • زبان مقاله: فارسی
  • تعداد مشاهده: 711
دانلود فایل این مقاله

نویسندگان

طیبه صحرانشین

گروه آموزشی کامپیوتر، دانشگاه آزاد اسلامی واحد علوم و تحقیقات هرمزگان، بندرعباس

علی هارون آبادی

گروه آموزشی کامپیوتر، دانشگاه آزاد اسلامی واحد تهران مرکز، تهران

وحید ستاری نائینی

گروه آموزشی کامپیوتر، دانشگاه شهید باهنر کرمان، کرمان

چکیده

اسناد XML به دلیل انعطاف پذیری بالا و ذات خود توصیفی به عنوان یکی از روش های موجود برای نمایش و انتقال اطلاعات مورد استقبال قرار گرفته اند و بسیاری از منابع اطلاعاتی از این روش استفاده می کنند. با توجه به رشد روز افزون استفاده از اینترنت و جستجوی اطلاعات به کمک موتورهای جستجو، به کارگیری روش هایی که به بالا بردن کیفیت نتایج جستجو کمک می کنند، الزامی است. خوشه بندی را می توان به عنوان مهمترین مسئله در یادگیری بدون نظارت در نظر گرفت. خوشه بندی با یافتن یک ساختار درون یک مجموعه از داده های بدون برچسب درگیر است. خوشه به مجموعه ای از داده ها گفته می شود که به هم شباهت داشته باشند. در خوشه بندی سعی می شود تا داده ها به خوشه هایی تقسیم شوند که شباهت بین داده های درون هر خوشه حداکثر و شباهت بین داده های درون خوشه های متفاوت حداقل شود. در این مقاله سعی بر آن شده است که روشهای متفاوت خوشه بندی مورد بررسی قرار گیرد و روش بهتری برای خوشه بندی اسناد XML پیشنهاد شود که روش ارائه شده خوشه بندی ساختار- محتوایی می باشد.

کلیدواژه ها

اسناد XML ، خوشه بندی سلسله مراتبی، خوشه بندی محتوایی، خوشه بندی ساختاری

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.