بهبود کارائی و دقت یافتن یال های پرتکرار در خلاصه سازی gMatrix از جریان گراف
سال انتشار: 1400
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 198
فایل این مقاله در 21 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_AICTI-12-45_004
تاریخ نمایه سازی: 29 آذر 1402
چکیده مقاله:
در سیستم های کاربردی، گراف ها با دامنه وسیعی از راس ها وجود دارند و یال ها به سرعت زیادی در قالب جریان گراف تولید می شوند. یکی از مسائل موجود در جریان های گراف سنگین که به صورت لحظه ای وارد می شوند پیدا کردن زیرگراف های پرتکرار است. خلاصه های جریان مبتنی بر طرح، مانند count-min، اطلاعات گره های پرتکرار را با دقت قابل قبولی نگهداری می کنند ولی ساختار گراف اصلی را از دست می دهند. از بین این روش ها، gMatrix ساختاری می باشد که مشخصات گراف اصلی را نیز حفظ می کند. این روش از توابع درهم ساز مختلف، برای ذخیره ی خلاصه ی جریان گراف استفاده کرده و به کمک این توابع و معکوس آنها، زیرگراف های پرتکرار را به دست می آورد. به دلیل داشتن حجم کمتر از جریان اصلی، gMatrix معمولا به پرس و جوها با دقت بالایی پاسخ نمی دهد. همچنین این روش از مشکل مرتبه ی زمانی بالا در پاسخ به پرس و جو ها هم رنج می برد. در این مقاله روش جدیدی ارائه شده است که به ازای هزینه ی کم حافظه ی مصرفی، زمان پاسخگویی به پرس و جو زیرگراف پرتکرار را به صورت چشم گیری کاهش می دهد. همچنین الگوریتم ارایه شده با افزایش استقلال بین توابع در هم سازی با استفاده از روش شباهت برداری کساین، احتمال برخورد عناصر در هم سازی شده را کاهش می دهد. نتایج آزمایشات تجربی که به زبان C++ پیاده سازی شده است و بر روی داده های شبکه اجتماعی فرندستر اجرا شده است، نشان می دهد که روش پیشنهادی برای یافتن زیرگراف های پرتکرار پیچیدگی زمانی و دقت یافتن این زیر گراف ها را بهبود می بخشد.
کلیدواژه ها:
نویسندگان
حمیدرضا رخصتی
دانشگاه صنعتی خواجه نصیرالدین طوسی