مروری بر مفهوم کلان داده

  • سال انتشار: 1395
  • محل انتشار: کنفرانس بین المللی مهندسی کامپیوتر و فناوری اطلاعات
  • کد COI اختصاصی: CITCOMP01_312
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1249
دانلود فایل این مقاله

نویسندگان

فریبا علیزاده

دانشجوی کارشناسی IT، دانشگاه علمی کاربردی مخابرات، تبریز، ایران

بابک زارع

دانشجوی کارشناسی IT، دانشگاه علمی کاربردی مخابرات، تبریز، ایران

فهیمه آقازاده

کارشناس ارشد کامپیوتر-نرم افزار، مدرس دانشگاه تبریز، ایران

چکیده

کلان داده ها به هر مجموعه ی بسیار وسیع و پیچیده ای اطلاق می شود که پردازش آن با استفاده از برنامه های پردازش داده ی سنتی مشکل است. کار باکلان داده ها با استفاده از سامانه های مدیریت پایگاه داده های منطقی و آمار کتابخانه ای سخت است و در مقابل نیازمند نرم افزارهای موازی بسیاری است که روی ده ها، صدها یا حتی هزاران سرور اجرا می شوند. کلان داده ها معمولاً شامل مجموعه داده هایی هستند که دارای اندازه ای می باشند که معمولاً فراتر از توانایی معمول ابزار نرم افزاری برای گرفتن، انتخاب، مدیریت و پردازش داده ها در یک زمان معین می باشند. اندازه ای داده های عظیم یک موضوع متغیر است که از چند ده ترابایت تا چندین پتابایت داده متغیر است. کلان داده ها مجموعه ای از تکنیک ها و فناوری هایی است که نیازمند فرم های جدید اختلاط برای آشکار کردن مقادیر پنهان وسیع از روی مجموعه داده هایی است که متنوع، پیچیده و بزرگ مقیاس می باشند. محیط داده های وسیع برای کسب، سازمان دهی و تجزیه وتحلیل انواع مختلف داده ها مورداستفاده قرار می گیرد. یک مشاهده در مورد چارچوب نگاشت کاهش وجود دارد که این چارچوب میزان وسیع داده های متوسط را تولید می کند. در این مقاله مروری بر مفهوم کلان داده و مهم ترین مسائل پیرامون آن خواهیم داشت.

کلیدواژه ها

کلان داده ها، هادوپ، HDFS، پیگ، هایو

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.