روش های طبقه بندی اسناد

  • سال انتشار: 1396
  • محل انتشار: نشریه علمی، پژوهشی و فناوری البرز، دوره: 3، شماره: 10
  • کد COI اختصاصی: JR_PSRT-3-10_001
  • زبان مقاله: فارسی
  • تعداد مشاهده: 2245
دانلود فایل این مقاله

نویسندگان

شیوا حسن زاده

مدرس، دانشگاه آزاد اسلامی ، دزفول،

مجید خلیلیان

استادیار، گروه مهندسی کامپیوتر، دانشکده مکاترونیک، واحد کرج، دانشگاه آزاد اسلامی، کرج، البرز، ایران.

چکیده

اطلاعاتی که در زمینه های گوناگون توسط کاربران گردآوری شده است نیازمند مدیریت و سازماندهی مناسبی هستندتا به صورت استاندارد، ساختار بندی شده و بازیابی آنها نیز راحت تر و سریع تر انجام شود. طبقه بندی از روشهای مهم در داده کاوی است. طبقه بندی اسناد یکی از روشهای متداول برای تفکیک موضوعی متن از بین متون علمی، صفحات وب و کتابخانه دیجیتال است. روش ها و تکنیک های مختلف با استفاده از الگوریتم های گوناگون برای طبقه بندی اسناد پیشنهاد شده اند که هرکدام مزایا و معایبی دارند. در این مقاله چندین روش طبقه بندی اسناد بصورت نظارت شده و نظارت نشده بررسی و مقایسه شده اند.

کلیدواژه ها

طبقه بندی اسناد- طبقه بندی نظارت شده- طبقه بندی نظارت نشده- بازیابی اطلاعات- الگوریتم افرازبندی-الگوریتم k-means

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.