الگوریتم خوشه بندی اسناد بر پایه الگوریتم K-MEANS بهبود یافته

خوشه بندی یکی از مسائل مهم داده کاوی است که هدف آن گروه گروه کردن تعدادی از اشیاء به طوری است که اشیاء درون یک گروه به هم شباهت بیشتری داشته و اشیاء دو گروه مختلف نسبت به هم متفاوت باشند. در این مقاله به مسئله خوشه بندی اسناد پرداخته شده است. الگوریتم خوشه بندی به کاررفته بر اساس الگوریتم K-Means است. اعمال تغییراتی در این الگوریتم از جمله تعیین تعداد تکرار مرحله پالایش برحسب یک مقدار آستانه، اعمال تکنیک N-Gram و تکنیک های دیگر باعث افزایش درصد موفقیت الگوریتم، بیش از 12 درصد در مجموعه فارسی آزمایش شده و حدود 25 درصد در مجموعه انگلیسی آزمایش شده، شده است.

کلیدواژه ها:

الگوریتم K-Means ، الگوریتم K-Means بهبود یافته ، پردازش متن ، خوشه بندی اسناد

نویسندگان

محمدرضا بهشتی پور

دانشگاه صنعتی مالک اشتر

بهروز مینایی بیدگلی

دانشگاه علم و صنعت ایران

محمدحسین الهی منش

دانشگاه آزاد اسلامی واحد قزوین، قزوین

عباس غلامزاده مراغه

دانشگاه صنعتی مالک اشتر

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/265294

شناسه ملی سند علمی:

ISCEE16_233

تاریخ نمایه سازی: 21 تیر 1393

نحوه استناد به مقاله:

در صورتی که می خواهید در اثر پژوهشی خود به این مقاله ارجاع دهید، به سادگی می توانید از عبارت زیر در بخش منابع و مراجع استفاده نمایید:

بهشتی پور، محمدرضا و مینایی بیدگلی، بهروز و الهی منش، محمدحسین و غلامزاده مراغه، عباس،1392،الگوریتم خوشه بندی اسناد بر پایه الگوریتم K-MEANS بهبود یافته،شانزدهمین کنفرانس دانشجویی مهندسی برق ایران،کازرون،https://civilica.com/doc/265294

در داخل متن نیز هر جا که به عبارت و یا دستاوردی از این مقاله اشاره شود پس از ذکر مطلب، در داخل پارانتز، مشخصات زیر نوشته می شود.
برای بار اول: (1392، بهشتی پور، محمدرضا؛ بهروز مینایی بیدگلی و محمدحسین الهی منش و عباس غلامزاده مراغه)
برای بار دوم به بعد: (1392، بهشتی پور؛ مینایی بیدگلی و الهی منش و غلامزاده مراغه)
برای آشنایی کامل با نحوه مرجع نویسی لطفا بخش راهنمای سیویلیکا (مرجع دهی) را ملاحظه نمایید.

علم سنجی و رتبه بندی مقاله

مشخصات مرکز تولید کننده این مقاله به صورت زیر است:

رتبه علمی دانشگاه صنعتی مالک اشتر

نوع مرکز: دانشگاه دولتی

تعداد مقالات: 13,241

در بخش علم سنجی پایگاه سیویلیکا می توانید رتبه بندی علمی مراکز دانشگاهی و پژوهشی کشور را بر اساس آمار مقالات نمایه شده مشاهده نمایید.

مقالات پیشنهادی مرتبط

مقالات فوق بر اساس داده کاوی مقالات مطالعه شده توسط پژوهشگران محاسبه شده است.

مقالات مرتبط جدید