ارایه روشی برای خوشه بندی متن با استفاده از نگاشت / کاهش

سال انتشار: 1395
محل انتشار: همایش ملی مهندسی برق مجلسی
کد COI اختصاصی: NCEEM01_016
زبان مقاله: فارسی
تعداد مشاهده: 528

نویسندگان

دانشجوی کارشناسی ارشد گروه.مهندسی کامپیوتر، واحد میبد، دانشگاه آزاد اسلامی، میبد، ایران

عضو هیات علمی گروه مهندسی کامپیوتر واحد میبد، دانشگاه آزاد اسلامی، میبد، ایران

چکیده

امروزه تکنیک های جمع آوری، استخراج و کشف دانش مورد نیاز از اطلاعات و متون، مورد توجه بسیاری از فرماندهان ومدیران قرار گرفته است. اطلاعات در کانون مجموعه فرماندهی، کنترل و اجرای عملیات نظامی قرار دارد که هر رویدادیدر زندگی امروزی حول محور ایجاد، دستکاری، انتقال و استفاده از اطلاعات قرار دارد. با گسترش شگرف اینترنت درجهت ارایه یا کسب اطلاعات، شاهد حجم انبوهی از اسناد و مقالات هستیم که دسترسی سریع و صحیح به منابع مهم ومورد علاقه ، یکی از دغدغه های استفاده کنندگان از این منبع اطلاعاتی بسیار بزرگ است. برای متن کاوی و کشفموضوع از صفحات متنی فناوری های فراوانی ارایه شده است. یکی از این فناوری های قدرتمند خوشه بندی است.اغلب داده های اینترنت در قالب های نیمه ساخت یافته می باشند. XML یکی از قالب های نیمه ساخت یافته اینترنتاست که وجود ساختار و محتوای داده در آن ، باعث شده است که بسیاری از روش های خوشه بندی کلاسیک عملا قابلاعمال بر روی حجم زیادی از اطلاعات با این فرمت نمی باشند. یکی از الگوریتم های خوشه بندی اسناد XML الگوریتمXCLS می باشد. در این مقاله این الگوریتم مورد بررسی قرار گرفته و در پایان با استفاده از مدل برنامه نویسی نگاشت/ کاهش روش جدیدی به منظور برطرف کردن مشکلات الگوریتم پیشین و بالا بردن سرعت و دقت خوشه بندی، پیشنهادشده است.

کلیدواژه ها

خوشه بندی ، اسناد XML و نگاشت / کاهش

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.