مروری بر اندازه گیری صحت و کیفیت داده ها

  • سال انتشار: 1396
  • محل انتشار: سومین کنفرانس ملی نوآوری و تحقیق در مهندسی برق و مهندسی کامپیوتر و مکانیک ایران
  • کد COI اختصاصی: ICCONF03_011
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1346
دانلود فایل این مقاله

نویسندگان

الهه السادات مصطفوی

کارشناسی ارشد مهندسی کامپیوتر گرایش نرم افزار دانشگاه آزاد اسلامی واحد ملارد

چکیده

یکی از کاربردهای عمده نسل آتی سیستم های موازی و توزیع شده، مربوط به تحلیل داده های عظیم است. مخازن داده برای چنین کاربردهایی امروزه بیش از چندین اگزابایت بوده و به سرعت نیز در حال افزایش هستند. علیرغم حجم بسیار زیاد این مخازن، این دیتاست ها و همچنین اپلیکیشن های نظیر آنها، چالش های عمده ای را برای متدها و نرم افزارهای برنامه نویسی مربوطه ایجاد کرده اند. دیتاست ها معمولا توزیع شده بوده و نیز حجم آنها و دسترسی مجاز به آنها توسط تکنیک های توزیع شده تضمین شده است. داده ها معمولا روی یک پلت فورم با قابلیت محاسباتی و شبکه ای بالا، مقیم هستند. توجه به میزان تحمل خطا، امنیت، و کنترل دسترسی موضوع مهمی در بسیاری از کاربردهاست. برای بیشتر کاربردهای درحال ظهور، مدل ها و متدهای مبتنی بر داده، که قادر به عملیات در مقیاس های مختلف هستند، هنوز برایمان ناشناخته است. حتی درصورتی که متدهای شناخته شده مقیاس پذیر باشند، اعتبارسنجی نتایج آنها موضوع مهمی خواهد بود. مشخصات پلت فورم های سخت افزاری و نیز پشته های نرم افزاری، اساسا تحلیل داده ها را تحت تاثیر قرار داده اند. در این پژوهش ابتدا به بررسی مدیریت کیفیت داده ها و تولید آنها می پردازیم. در بخش های بعدی مقیاس و محدوده تحلیل داده و ویژگی های حجم کار را مورد بررسی قرار می دهیم و با ارایه نتیجه گیری بحث خود را پایان می دهیم.

کلیدواژه ها

اندازه گیری داده، صحت داده ها، کیفیت داده، داده های بزرگ، تجزیه و تحلیل، مراکز داده

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.