مروری بر داده های بزرگ و فناوری پردازش هدوپ و آپاچی اسپارک

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 661

فایل این مقاله در 16 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

TECCONF04_189

تاریخ نمایه سازی: 30 شهریور 1398

چکیده مقاله:

امروزه حجم بالایی از اطلاعات توسط ابزارهای مانند برنامه های کاربردی، اینترنت، وبسایتها، شبکه های اجتماعی و اینترنت اشیاء ایجاد میشود که نوع آنها کلان داده است. کلان داده در واقع حجم بالایی از داده است که دارای ارزش اطلاعاتی بالا و نهفته است از این جهت تجزیه و تحلیل آنها باعث میشود که این دانش مفید استخراج شود. پردازش این حجم زیاد از اطلاعات قاعدتا0 با زمان زیاد و البته فناوری خاص نیاز دارد تا اطلاعات و الگوهای مفید دانش استخراج گردد. یکی از فناوری های پردازش کلان داده که بر اساس سیستمهای پردازش توزیع شده عمل مینماید استفاده از فناوری آپاچی اسپارک در پردازش کلان داده است. آپاچی اسپارک یک بستر پردازش کلان داده است و میتوان آن را نسخه پیشرفته فناوری هدوپ نیز در نظر گرفت. سیستم پردازش آپاچی اسپارک برای پردازش توزیع شده خود از فناوری پردازش مبتنی بر نگاشت و کاهش استفاده مینماید و پردازش را بر روی مجموعه ای از خوشه ها یا کلاسترها اجراء می نماید و میتوان زمان پردازش داده ها را کاهش دهد. در این مقاله مروری خواهیم داشت بر فناوری محاسبات ابری، پردازش توزیع شده آپاچی اسپارک، هدوپ، نگاشت وکاهش که در واقع در یک راستاء قرار دارند. نتایج مطالعاتی ما نشان میدهد استفاده از فناوری آپاچی اسپارک به علت استفاده از حافظه اصلی در پردازشها تا 10 برابر شتاب بیشتری نسبت به معماریهای رقیب مانند هدوپ دارد.

نویسندگان

میثم چهاردولی

گروه کامپیوتر،واحد اراک، دانشگاه آزاد اسلامی،اراک،ایران

نفیسه اوسطی عراقی

گروه کامپیوتر،واحد اراک، دانشگاه آزاد اسلامی،اراک،ایران