دسته بندی متون به روش مرکزیت کلاسی

  • سال انتشار: 1382
  • محل انتشار: یازدهمین کنفرانس مهندسی برق
  • کد COI اختصاصی: ICEE11_030
  • زبان مقاله: فارسی
  • تعداد مشاهده: 827
دانلود فایل این مقاله

نویسندگان

سعید جلیلی

دانشگاه تربیت مدرس گروه مهندسی کامپیوتر

علی آقایی النجق

چکیده

با رشد سریع تولید اطلاعات الکترونیکی، لزوم دسته بندی اطلاعات بیشتر از گذشته احساس می شو د. استفاده از نیروی انسانی برای دسته بندی حجم وسیعی از اسناد هم از لحاظ هزینه و هم از لحاظ زمان مقرون به صرفه نیست . برای این منظور رو شهای خودکار دسته بندی متون ارایه شده است . در جامعه محققین، رو شهای آماری نسبت به سایر روشها از توجه بیشتری برخوردار بوده است. در این تحقیق، روش مرکزیت کلاسی تدوین شده است که تا حدودی مشابه روش کلاسیکRocchio می باشد. آزمون های انجام شده براساس زیر مجموعه ای از اسناد رویتر 21578 بهبود محسوسی را نسبت به روش Rocchio نشان می دهد و اختلاف کارایی روش مرکزیت کلاسی نسبت به روش SVM که جزء روش های بسیار کارا در دسته بندی متون است بسیار کم است.

کلیدواژه ها

دسته بندی متون، مرکزیت کلاسی، دسته بندی آماری، دسته بند

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.