بررسی طبقه بندی و تولید داده های تصویری با حفظ حریم خصوصی
سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 4
فایل این مقاله در 20 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICOCS14_099
تاریخ نمایه سازی: 20 بهمن 1404
چکیده مقاله:
با گسترش خدمات الکترونیکی و سهولت در جمع آوری و ذخیره سازی داده ها، حجم وسیعی از اطلاعات افراد در قالب رکوردهایی درون پایگاه داده سازمان های خصوصی و دولتی ذخیره شده است. این رکوردها به طور معمول شامل اطلاعات حساس شخصی از جمله میزان درآمد و نوع بیماری هستند که باید از خارج از دسترس سایرین نگه داشته شود. اگر مخفی کردن اطلاعات حساس رکوردها به درستی انجام گیرد، تاثیر مخربی در سودمندی داده ها ندارد؛ زیرا در اکثر مواقع دریافت کنندگان داده به دنبال مشخصات افراد و داده های سطح رکورد نیستند و می خواهند قوانین و الگوهایی کلی و در سطح مجموعه داده به دست بیاورند. «حفظ حریم خصوصی در انتشار داده ها» راهکارهایی برای تضمین محرمانه ماندن اطلاعات حساس یک مجموعه داده در هنگام انتشار آن در محیطی غیر قابل اعتماد است. در این فرایند سعی بر آن است که ضمن مخفی نگه داشتن اطلاعات حساس، داده های منتشر شده همچنان برای عملیات کشف دانش مفید باقی بماند. این نوشتار با هدف مرور روش های حفظ حریم خصوصی داده ها به نگارش درآمده است. امروزه، حفظ حریم خصوصی داده های منتشر شده، از اهمیت زیادی برخوردار است. الگوریتم های مختلفی برای حفظ حریم خصوصی داده ها ابداع شده است. مهمترین مشکلات این الگوریتم ها، غیر قابل اثبات بودن حریم خصوصی آن ها، اهمیت کم در نظر گرفته شده برای دانش پیش زمینه فرد متخاصم و عدم کاهش ابعاد داده های اولیه است. در این مقاله، برای اثبات حریم خصوصی داده ها از مفهوم حریم خصوصی تفاضلی در انتشار داده های توزیع شده عمودی و رده بندی آنها استفاده شده است. در حریم خصوصی تفاضلی، دانش پیش زمینه فرد متخاصم در مورد داده های منتشر شده، اهمیت ندارد. همچنین، با استفاده از تبدیل موجک هار، ابعاد داده ها کاهش داده شده است. در نهایت، حریم خصوصی داده های منتشر شده به صورت ریاضی اثبات شده است، همچنین، دقت داده ها، با استفاده از الگوریتم رده بند «K-نزدیکترین همسایه» نیز اندازه گیری شده است و به صورت ریاضی اثبات شده است که الگوریتم پیشنهادی، خدشه هایی با انحراف معیار کمتری را نسبت به الگوریتم مورد مقایسه، به داده ها اضافه می کند و در نتیجه دقت رده بندی بالاتری دارد. نتایج به دست آمده نشان دهنده امن تر بودن الگوریتم ارائه شده نسبت به الگوریتم های مورد مقایسه است. تولید و طبقه بندی داده های تصویر مصنوعی با حفظ حریم خصوصی: بینایی کامپیوتر، مدل های مولد (مانند ChatGPT و غیره) و یادگیری عمیق اکنون به طور گسترده در بخش های مختلف، از شرکت های بزرگ گرفته تا دستگاه های نهایی، مورد استفاده قرار می گیرند و زندگی افراد را ساده کرده و قابلیت اطمینان یافته های پزشکی را بهبود می بخشند. داده های تصویری حساس و ظرفیت بالای به خاطر سپردن یادگیری عمیق، خطراتی را برای حریم خصوصی، به ویژه برای تصاویر پزشکی حاوی اطلاعات خصوصی حساس، ایجاد می کنند. ناشناس سازی به دلیل خطر شناسایی مجدد و کاهش کاربرد، کار نمی کند. بنابراین، ما یک رویکرد خصوصی-تفاضلی با افزودن نویز انتخابی برای تولید داده های تصویر پزشکی مصنوعی با ابعاد بالا با حریم خصوصی تفاضلی تضمین شده، توسعه دادیم. علاوه بر تضمین حریم خصوصی داده ها، محافظت از حریم خصوصی مدل طبقه بندی به دلیل آسیب پذیری آن در برابر «حملات استنتاج عضویت» بسیار مهم است. دفاع های پیشرفته (مانند حریم خصوصی تفاضلی و غیره) دقت کار را برای حفظ حریم خصوصی به خطر می اندازند و برخی از روش ها از داده های خصوصی دوباره استفاده می کنند یا به داده های عمومی بیشتری نیاز دارند که در برخی حوزه ها غیرعملی است. برای پرداختن به نگرانی های مربوط به حریم خصوصی و در عین حال حفظ سودمندی، ما یک رویکرد تقطیر مشارکتی پیشنهاد می کنیم که دانش را با استفاده از حداقل داده های مصنوعی منتقل می کند و منجر به یک مدل طبقه بندی خصوصی فشرده می شود.
کلیدواژه ها:
نویسندگان