مدل داده مناسب برای داده های عظیم

  • سال انتشار: 1393
  • محل انتشار: همایش داده های عظیم
  • کد COI اختصاصی: BIGDATA01_021
  • زبان مقاله: فارسی
  • تعداد مشاهده: 510
دانلود فایل این مقاله

نویسندگان

علی اصغر صفایی

گروه انفورماتیک پزشکی، دانشگاه تربیت مدرس

سیدعلی ظهیری مطلق

گروه انفورماتیک پزشکی، دانشگاه تربیت مدرس

چکیده

امروزه در بسیاری از کاربردهای داده- محور، با حجم انبوهی از داده ها مواجه هستیم که پردازش و بهره برداری از آنها الگوهای گذشته مدیریت داده ها را نیازمند تغییر نموده است. البته این مسیله که به نام داده های عظیم شناخته می شود فراتر از صرفا حجم بالا بوده و دارای سه بعد اساسی حجم بالا، تنوع بالا، و سرعت بالا می باشد. اگرچه در طول سالیان گذشته کارهای فراوانی در خصوص هریک از این سه خصیصه به تنهایی صورت گرفته است، اما مقیاس هریک از این خصیصه ها در کاربردهای امروزی و پیچیدگی ناشی از ترکیب شدن آنها سبب می شود تا راهکارهای قدیمی دیگر به کار نیایند یا ناکارآمد باشند. از طرفی، در بسیاری از کاربردهای جدی نمی توان منتظر ماند تا مبانی نظری مسیله داده های عظیم به تکامل و بلوغ برسد و سپس سامانه ها و ابزارها توسعه داده و ارایه شوند؛ بلکه متولیان این کاربردها خود دست به کار شده و ابزارهایی برای اداره داده های عظیم سازمان و کاربرد خود فراهم و استفاده کرده اند. یکی از اساسی ترین و بنیادی ترین کارهایی که برای مدیریت داده های عظیم باید انجام گیرد، ارایه و استفاده از یک مدل داده مناسب است. مدل داده، سنگ بنای سایر فعالیت های مربوط به مدیریت داده ها محسوب می شود و روش ها، الگوریتم، سامانه ها، ابزارها و زبان ها مبتنی بر مدل داده طراحی و ارایه می شوند. در این مقاله، مدل داده ای مناسب داده های عظیم ارایه شده که بر اساس نیازمندی های ابعاد سه گانه (3Vs) طراحی شده است. اصول مدنظر قرار گرفته در این طراحی و مدل داده طراحی شده ارایه شده، و مدل به صورت عملی و تجربیه مورد ارزیابی قرار گرفته است. از مهمترین ویژگی های مدل داده پیشنهادی می توان به این موارد اشاره نمود که ضمن تامین نمودن همه ویژگی های داده های عظیم، کاملا یکپارچه بوده و کارآمد (دارای کارایی و بهره وری قابل قبول) می باشد.

کلیدواژه ها

مدل داده، داده عظیم، مدل های NoSQL، گراف تودرتو

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.