مروری بر موازی سازی الگوریتم EP-Growth با استفاده از چهارچوب MapReduce

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 781

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ITCSC01_050

تاریخ نمایه سازی: 8 آبان 1395

چکیده مقاله:

کاوش مجموعه اقلام پرتکرار یک وظیفه داده کاوی پرکاربرد با هدف یافتن اقلام هم رخ داد پرتکرار و در نتیجه کشف وابستگی پنهان در داده ها می باشد. یکی از الگوریتم های یافتن اقلام پرتکرار FP- Growth است. این الگوریتم با وجود کارایی در استخراج الگوهای پرتکرار از پایگاه داده ای تراکنشی، از یپچیدگی زمانی بالا در زمان پردازش داده ای واقعی بسیار حجیم رنج می برد. لذا از روشهای توزیع شده و موازی که کارایی را با توجه به وهزینه محاسباتی و مقیاس پذیری بهبود می دهند استفاده می شود. MapReduce یک مدل برنامه نویسی موازی است و مفهوم جدیدی است که قدرت محاسباتی نامحدود و ذخیره سازی ارزان را فراهم می کند این مقاله به معرفی و مقایسه بعضی از تکنیکهای که اخیرا برای بهبود الگوریتم FP- Growth بر پایه MapReduce معرفی شده اند. پرداخته است. مرور این روشها نشان می دهد که نسخه های موازی نیز با چالشهای نظیر مشکل توازن بار تعداد زیاد اسکن پایگاه داده و سربار I/O و انجام تغیرات افزایشی در پایگاه داده های پویا روبرو هستند و تحقیقات اخیر بر روی برطرف کردن این مشکلات متمرکز شده اند.

نویسندگان

مریم حسنعلی

دانشجوی دکتری دانشگاه آزاد اسلامی واحد خوراسگان (اصفهان) گروه فنی مهندسی اصفهان ایران

مرضیه عمادی

دانشجوی دکترای دانشگاه آزاد سلامی واحد اصفهان گروه فنی مهندسی اصفهان ایران

فرساد زمانی بروجنی

استادیاردانشگاه آزاد اسلامی واحد خوراسگان، اصفهان گروه فنی مهندسی اصفهان ایران