بهبود کارائی و دقت یافتن یال های پرتکرار در خلاصه سازی gMatrix از جریان گراف

سال انتشار: 1400
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 198

فایل این مقاله در 21 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_AICTI-12-45_004

تاریخ نمایه سازی: 29 آذر 1402

چکیده مقاله:

در سیستم های کاربردی، گراف ها با دامنه وسیعی از راس ها وجود دارند و یال ها به سرعت زیادی در قالب جریان گراف تولید می شوند. یکی از مسائل موجود در جریان های گراف سنگین که به صورت لحظه ای وارد می شوند پیدا کردن زیرگراف های پرتکرار است. خلاصه های جریان مبتنی بر طرح، مانند count-min، اطلاعات گره های پرتکرار را با دقت قابل قبولی نگهداری می کنند ولی ساختار گراف اصلی را از دست می دهند. از بین این روش ها، gMatrix ساختاری می باشد که مشخصات گراف اصلی را نیز حفظ می کند. این روش از توابع درهم ساز مختلف، برای ذخیره ی خلاصه ی جریان گراف استفاده کرده و به کمک این توابع و معکوس آنها، زیرگراف های پرتکرار را به دست می آورد. به دلیل داشتن حجم کمتر از جریان اصلی، gMatrix معمولا به پرس و جوها با دقت بالایی پاسخ نمی دهد. همچنین این روش از مشکل مرتبه ی زمانی بالا در پاسخ به پرس و جو ها هم رنج می برد. در این مقاله روش جدیدی ارائه شده است که به ازای هزینه ی کم حافظه ی مصرفی، زمان پاسخگویی به پرس و جو زیرگراف پرتکرار را به صورت چشم گیری کاهش می دهد. همچنین الگوریتم ارایه شده با افزایش استقلال بین توابع در هم سازی با استفاده از روش شباهت برداری کساین، احتمال برخورد عناصر در هم سازی شده را کاهش می دهد. نتایج آزمایشات تجربی که به زبان C++ پیاده سازی شده است و بر روی داده های شبکه اجتماعی فرندستر اجرا شده است، نشان می دهد که روش پیشنهادی برای یافتن زیرگراف های پرتکرار پیچیدگی زمانی و دقت یافتن این زیر گراف ها را بهبود می بخشد.

کلیدواژه ها:

نویسندگان

حمیدرضا رخصتی

دانشگاه صنعتی خواجه نصیرالدین طوسی