ارائه مدلی جدید برای استخراج مکعب های OLAP ازپایگاه داده های نواسکیوال غیرساختارمند بر اساس الگوریتم شباهت

سال انتشار: 1401
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 195

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICPCONF08_026

تاریخ نمایه سازی: 9 مهر 1401

چکیده مقاله:

ظهور پلت فرم های مقیاس وسیع در وب مانند گوگل، فیس بوک، توییتر و غیره باعث شده است که در سال های اخیر با رشد چشمگیریاز تولید داده ها مواجه شویم که این امر باعث شده است مدل های رابطه ایی توانایی پشتیبانی و تجزیه و تحلیل چنین داده های یزرگ وپیچیده ایی را نداشته باشند. با توجه به تنوع و حجم داده ها و غیرساختارمند بودن داده ها پایگاه داده های غیر متمرکز با عنوان نواسکیوالمطرح شده است که در مقایسه با پایگاه داده های رابطه ایی مقیاس پذیر و انعطاف پذیر می باشد ولی با توجه به غیر ساختارمند بودن داده هااجرای پردازش تحلیلی بر روی خط ( OLAP ) بر روی پایگاه داده نواسکیوال چالش انگیز و دشوار است. در این مقاله، مدلی برای غلبه برمقادیر NULL ، در تبدیل پایگاه داده نواسکیوال به پایگاه داده رابطه ایی با استفاده از تکنیک های تشابه ارائه شده است. مدل پیشنهادیازچهار فاز اصلی شینگلینگ، چانک، Minhash ، و LSH تشکیل شده است. به طوری که هر فاز پروسه مناسبی را بر روی پایگاه دادهنواسکیوال انجام میدهد. LSH ، یکی از الگوریتم های شباهت تقریبی می باشد که از روش درهم سازی برای یافتن مشابهت عناصر استفادهمی کند به این ترتیب که داده هایی که به احتمال زیاد مشابه هستند را به یک باکت (سبد) نگاشت می کند. با توجه به سرعت و کاهشمیزان مقایسه لازم، مدل پیشنهادی ما در مقایسه با سایر راهکارها رویکردی مناسب و کارآمد می باشد

کلیدواژه ها:

نویسندگان

فرناز داوردوست

استاد گروه کامپیوتر واحد تبریز دانشگاه ازاد اسلامی تبریز ایران

منیژه صفرخانی گرگری

استاد گروه کامپیوتر، واحدکلیبر، دانشگاه آزاد اسلامی، کلیبر، ایران