مروری بر مدیریت پردازش دادگان عظیم با استفاده ازApache و MapReduce Spark
سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 542
فایل این مقاله در 15 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
OUTLOOKECE01_130
تاریخ نمایه سازی: 11 مرداد 1396
چکیده مقاله:
با ورود به عصردادگان عظیم و تولید انبوهی از انواع داده ها این ضرورت احساس می شود که باید از این انبوه داده ها برای کسب اطلاعات راهبردی استفاده کرد. اما با روش های تحلیل داده قدیمی نمی توان داد های متنوع تولید شده را به درستی تحلیل کرد. از این رو متخصصین علم داده کاوی روش هایی را برای تحلیل این نوع از داده ها ابداع کرده اند. اما سوال اینجاست که چه روشی برای تحلیل این داده ها مناسبتر است. در تحلیل داده گان عظیم، روش های پردازش موازی و توزیع شده مورد توجه قرار گرفته اند. چارچوب های مانند Hadoop MapReduce و Spark از این نوع هستند. در این مقاله با مرور عملکرد چارچوب های MapReduce Hadoop و Spark Apache در مواجه با انواع داده ای مختلف و کتابخانه های که برای این دو چارچوب توسعه داده شده اند، سعی کردیم مقایسه ای اجمالی از این دو بستر تحلیل داده داشته باشیم. در ادامه تفاوت فازهای Map و Reduce را بین Spark و MapReduce بررسی کردیم.
کلیدواژه ها:
نویسندگان
محمدرضا مرادی
گروه کامپیوتر ،واحد همدان،دانشگاه آزاد اسلامی همدان ،ایران
رسول روستایی
گروه کامپیوتر ،واحد همدان،دانشگاه آزاد اسلامی همدان ،ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :