الگوریتم های خوشه بندی در داده های عظیم

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,800

فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ITCC01_453

تاریخ نمایه سازی: 9 فروردین 1395

چکیده مقاله:

پردازش داده های عظیم و مدیریت آنها، در سال های اخیر، موردتوجه قرارگرفته است و چارچوب ها وابزارهای خاصی به این منظور معرفی شده اند و تجزیه وتحلیل داده ها بهعنوان مدیریت داده های عظیم،مورد مطالعه قرارگرفته اند. تکنیک های داده کاوی و یادگیری ماشین، امروزه در بسیاری از سازمان ها و صنایعبه منظور بهبود و پیش بینی و رونق کسب وکار مورداستفاده قرار می گیرند و با توجه به رشد اطلاعات سازمانیو حجم بالای آنها و تولید داده ها با سرعت بالا، تکنیک های داده کاوی در داده های عظیم، نقش مهمی را دراین تحولات ایفا می کنند. عملیات مختلفی برای مدیریت داده ها صورت می گیرد که گروهی از این عملیاتبه صورت پیش پردازش هایی هستند که بر روی داده ها انجام می شوند تا داده ها را برای انجام عملیات اصلی،آماده سازند. از طرفی در محیط های ابری، به دلیل توزیع شدگی محیط، عملیات گروه بندی و دسته بندیداده ها، اهمیت زیادی می یابد. در این مقاله، معروفترین الگوریتم خوشه بندی، K-Means ، موردبررسیقرارگرفته و بنا بر کارهای صورت گرفته بر روی این الگوریتم، روش هایی پیشنهاد می گردد که پارامترهایمهم در محیط های ابری را در نظر گرفته و خوشه بندی داده های عظیم را بهبود بخشد.

کلیدواژه ها:

نویسندگان

شیرین عباسی

دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد تهران مرکز

بابک وزیری

استادیار دانشگاه آزاد اسلامی واحد تهران مرکز

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • _ Internatiotal Conference om Information Technology, Computer & Communication 28 ...
  • _ Internatiotal Conference om Information Technology, Computer & Communication 28 ...
  • V. Hristidis, S. Chen, T. Li, S. Luis, and Y. ...
  • K. Grolinger, (20 1 3), "Disaster Dat Management in Cloud ...
  • D. Kossmann and T. Kraska, (2010), "Data Management in the ...
  • H.Dewan, R.Hansdah, (20 1 1), "A Survey of Cloud Storage ...
  • W. Halton, (2011), "Security Issues and Solutions in Cloud Computing", ...
  • F.Chung, J.Dean, (2008), "BigTable: a Distributed Storage System For Structured ...
  • W.Guo, C.Qiao, Y.Jin, (2010), _ D emonstration of Joint Resource ...
  • W.Vogels , (2009), "Eventually Consistent", ACM, Vol 52, No.1, PP.44-40. ...
  • P. Zadrozny and R. Kodali, (20 13), " Big Data ...
  • .]G.Decandia, D.Hastorun, M. Jampani, (2007), "Dynamo: Amazon highly Available Leyvalue ...
  • M. Stonebraker and et al, (2007), "The End of an ...
  • F. Ohlhorst, (2013), "Big Data Analytics: Turning Big Data into ...
  • A. Barrachina, A. O'Driscoll, (20 14), _ A big data ...
  • M.G. Jaatun, G. Zhao, and C. Rong (Eds.), (2009), : ...
  • F.Meyer, J. Chinrungrueng _ (2 004) _ _ Spatiotemporal clustering ...
  • J.Ernst, J.Nau, Z _ Bar-Joseph, (2 005), "Clustering short time ...
  • F.Iglesias, F.Kastner, (201 3), "Analysis of Similarity Measures in Times ...
  • 9]A. Shirkhorshidi et al, (2014), Big Data Clustering: A Review", ...
  • C.Boutsidis, C .Chekuri, T.Feder, R. Motwani, (20 10), 'Random projections ...
  • 1] G.Andradeand etal, (2013), " G-DB SCAN:A GPU Accelerated Algorithm ...
  • P.Anchalia, A. Koundinya, N. Srinath, (20 1 3), "MapReduce Design ...
  • B.Mirkin, (20 1 2), "Clustering for data mining a data ...
  • Y.He and et al, (2014), "MR-DB SCAN: _ scalable MapReduc ...
  • N.Shah, S. Mahajan, (20 14), Distributed Document Clustering Using K-Means", ...
  • Z.Le and et al, (2014), " K-means Clustering Optimization Algorithm ...
  • S.Su and et al, (2014), " Data Clustering Using Variants ...
  • A. Chadha, S.Kumar, _ Improved K-Means Clustering Algorithm: A Step ...
  • نمایش کامل مراجع