بررسی فشرده سازی داده های بزرگ با استفاده از بلوم فیلتر و الگوریتم های آن
سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 16
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
DMECONF10_228
تاریخ نمایه سازی: 1 مرداد 1404
چکیده مقاله:
فیلترهای بلوم آموخته شده (LBFs) با ترکیب طبقه بندهای یادگیری ماشین و ساختارهای داده ای سنتی، راهکاری نوین برای بهبود پرس وجوهای عضویت ارائه می دهند. این مطالعه به تحلیل کارایی LBF ها با تمرکز بر تاثیر پیچیدگی داده ها و انتخاب طبقه بند می پردازد. با استفاده از داده های پیچیده و پرنویز، ما نشان می دهیم که فیلترهای ساندویچی (SLBF) نرخ مثبت کاذب (FPR) کمتری نسبت به فیلترهای استاندارد دارند. این تحقیق همچنین پیشنهادهایی برای طراحی فیلترهای چندبعدی و بررسی تاثیر توزیع پرس وجوها ارائه می دهد که می تواند در کاربردهایی مثل شبکه های اطلاع محور و تحلیل مفید باشد. این مقاله با تمرکز بر ترکیب طبقه بندهای یادگیری ماشین با ساختارهای داده ای سنتی، به دنبال تحلیل تاثیر پیچیدگی داده ها و انتخاب نوع طبقه بند بر عملکرد این فیلترها می باشد. هدف اصلی، شناسایی عوامل کلیدی موثر بر کارایی LBF ها، از جمله نرخ مثبت کاذب (False Positive Rate - FPR) و مصرف حافظه، در سناریوهای مختلف داده ها، از داده های ساده و یکنواخت گرفته تا داده های پیچیده و پرنویز مانند داده های زیستی و URL ها است. این مطالعه به بررسی فیلترهای ساندویچی (Sandwich Learned Bloom Filters - SLBF) و ADA-BF می پردازد تا مشخص کند چگونه این ساختارها می توانند در کاربردهای متنوع، از جمله شبکه های اطلاع محور (ICN)، امنیت سایبری و بیوانفورماتیک، عملکرد بهینه ای ارائه دهند. علاوه بر این مقاله به دنبال ارائه راهنمایی هایی برای طراحی فیلترهای چندبعدی است که بتوانند با داده های چندمنظوره و پویا سازگار شوند. با انجام آزمایش هایی روی داده های واقعی، مانند توالی های RNA-seq و لیست های سیاه URL، این مطالعه قصد دارد پتانسیل LBF ها را در بهبود سرعت پردازش و دقت پیشبینی عضویت در مجموعه های بزرگ داده ها ارزیابی کند. همچنین، این پژوهش به بررسی تاثیر توزیع پرس وجوها بر عملکرد فیلترها می پردازد تا چارچوبی برای بهینه سازی این ساختارها در محیط های عملی ارائه دهد. در نهایت، هدف این تحقیق، ارتقای درک نظری و عملی از LBF ها و کمک به توسعه ساختارهای داده ای پیشرفته تر برای کاربردهای مدرن در پردازش داده های بزرگ است.
کلیدواژه ها:
نویسندگان
نهال نورپرور
دانشجوی تحصیلات تکمیلی مهندسی کامپیوتر، دانشکده هوش مصنوعی و فناوری های اجتماعی و پیشرفته، واحد اصفهان (خوراسگان)، دانشگاه آزاد اسلامی، اصفهان، ایران
فرزانه کاویانی
گروه کامپیوتر، دانشکده هوش مصنوعی و فناوری های اجتماعی و پیشرفته، واحد اصفهان (خوراسگان)، دانشگاه آزاد اسلامی، اصفهان، ایران