بررسی روش های خوشه بندی اسناد

سال انتشار: 1397
محل انتشار: چهارمین کنفرانس ملی محاسبات نرم در مهندسی برق و کامپیوتر
کد COI اختصاصی: SCECE04_055
زبان مقاله: فارسی
تعداد مشاهده: 508

نویسندگان

گروه مهندسی کامپیوتر، واحد شیراز، دانشگاه آزاد اسلامی، شیراز، ایران

گروه مهندسی کامپیوتر، واحد شیراز، دانشگاه آزاد اسلامی، شیراز، ایران،

چکیده

امروزه حجم عظیم اسناد در ادارات، سازمان ها، شرکت های بزرگ و سایر سیستم های زیربط باعث ایجاد یک چالش عظیم درمدیریت این نوع داده ها شده است. تحلیل محتویات داده و گروه بندی آنها در شاخه های مرتبط نیز از جمله چالش های بسیاری از موتورهای جستجوگر، ژورنال ها و غیره است. تا کنون نیز روش های مختلفی ارایه شده است که علارغم کارایی که دارند؛ اما همچنان با دقت کافی و مطلوبی نتوان سته اند به خو شه بندی ا سناد بپردازند. خو شه بندی داده ها بر ا ساس شباهت از جمله مراحل مهم در تحلیل داده ها و یکی از ابزارهای پرکاربرد در حوزه داده کاوی است. به دلیل توانمندی روش های خوشه بندی در تولید خوشه های با کیفیت توسعه این الگوریتم ها برای مدیریت و دسته بندی داده ها یکی از اهداف این مقاله می باشد. در این مقاله به بررسی روش های خوشه بندی اسناد پرداخته می شود.

کلیدواژه ها

خوشه بندی اسناد، خوشه بندی داده ها، شباهت، داده کاوی

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.