ارزیابی عملکرد سیستمهای پردازش توزیع شده گرافهای مقیاس بزرگ

  • سال انتشار: 1398
  • محل انتشار: پنجمین کنفرانس ملی محاسبات توزیعی و پردازش داده های بزرگ
  • کد COI اختصاصی: DCBDP05_073
  • زبان مقاله: فارسی
  • تعداد مشاهده: 737
دانلود فایل این مقاله

نویسندگان

فاطمه السادات بکائی

دانشجوی کارشناسی ارشد، گروه مهندسی کامپیوتر، دانشگاه یزد، یزد

امیر جهانگردرفسنجانی

استادیار، گروه مهندسی کامپیوتر، دانشگاه یزد، یزد

چکیده

با افزایش حجم اطلاعات، داده های بزرگ در مرکز توجه علوم و تحقیقات قرار گرفته اند. به دنبال آن، ساختارهای بزرگ گراف در مقیاس ترا و پتا بایت که تعداد راسها و یالهای آنها به میلیونها و حتی میلیاردها میرسند، بسیار رایج شدهاند و تجزیه و تحلیل آنها، به زمینه ی پژوهشی در حوزه ی داده های بزرگ تبدیل شده است. با توجه به اندازه و ساختار نامنظم و پراکنده ی گرافهای بزرگ و همچنین ماهیت تکراری الگوریتم های گراف که به منابع و توان محاسباتی زیادی نیاز دارند، پردازش و به دست آوردن دانش از آنها چالش برانگیز است. در سالهای اخیر پژوهشهای زیادی به منظور توسعه ی سیستمهای توزیع شده ی پردازش گراف انجام شده است. ابتدا در سال 2012 گوگل با معرفی پریجل به عنوان سیستمی مقیاسپذیر و مقاوم در برابر خطا، پیشگام این حوزه شده است. از آن زمان، شاهد توسعه ی تعداد زیادی از سیستمهای تخصصی پردازش گراف از جمله آپاچی جیراف، گرافلب، گرافایکس، پاورگراف و بسیاری دیگر هستیم. با گسترش تنوع این سیستمها و وجود گرافها و الگوریتم های با ویژگیهای متفاوت، ارزیابی عملکرد سیستمهای پردازش گراف اهمیت ویژه ای دارد.این مقاله، قابلیت استفاده و عملکرد دو سیستم پردازش گراف آپاچی جیراف و گرافایکس را با اجرای چهار الگوریتم رتبه بندی صفحات، شمارش مثلث، یافتن مولفه های همبندی و جستجوی سطح اول روی شش مجموعه داده ی واقعی از حوزه های کاربردی مختلف از جمله وب، شبکه های اجتماعی و شبکه های استنادی بررسی میکند. در این پژوهش قدرت پردازش، استفاده از منابع و مقیاس پذیری سیستمها مورد ارزیابی قرار گرفته اند. نتایج نشان میدهند هیچکدام از سیستمها دارای عملکرد برتر در تمامی آزمایشها نمی باشند و کارایی سیستمها روی الگویتمها و گرافهای با ویژگیهای متفاوت، متغیر است.

کلیدواژه ها

گراف های بزرگ، پردازش توزیع شده، سیستمهای پردازش گراف، ارزیابی عملکرد

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.