یک روش خوشه بندی توزیع شده مبتنی بر Kmeans برای حفظ محرمانگی در انتشار داده های حجیم

  • سال انتشار: 1401
  • محل انتشار: اولین کنفرانس بین المللی و ششمین کنفرانس ملی کامپیوتر، فناوری اطلاعات و کاربردهای هوش مصنوعی
  • کد COI اختصاصی: CEITCONF06_071
  • زبان مقاله: فارسی
  • تعداد مشاهده: 222
دانلود فایل این مقاله

نویسندگان

فاروق اشکوتی

استادیار هیات علمی دانشگاه،گروه کامپیوتر ،واحد مهاباد،دانشگاه آز اد اسلامی،مهاباد،ایران

رحیم رشیدی

استادیار هیات علمی دانشگاه،گروه کامپیوتر ،واحد بوکان دانشگاه آزاد اسلامی ،بوکان،ایران

چکیده

یکی از مراحل اساسی در چرخه حیات داده،انتشار آن برای تحلیل گران داده جهت کشف الگوهای مفید و ناشناخته است.انتشار داده ممکن است،باعث افشای ناخواسته اطلاعات افراد شود و مشکلاتی برای نامحرمانگی ایجاد کند.تحقیقات نشان داده ایت که گمنام سازی داده برای برا.رد کردن مدل های محرمانگی در داده های انتشاری یک روش کارا برای جلوگیری از افشای اطلاعات محرمانه افراد است.در این مقاله،برای گمنام سازی داده ها،از خوشه بندی سلسله مراتبی داده ها جهت براورد کردن مدل،l-diversity استفاده می شود. ما دو تابع فاصله جدید بر اساس فاصله منهتن و اقلیدس برای محاسبه فاصله رکورد ها در الگوریتم خوشه بندیk-means ارائه داده ایم،که این تابع نیاز های مدل محرمانگی l-diversity را داده های انتشاری براوره می کنند .یکی از نیاز های روش های گمنام سازی برقراری مصالحه بین محرمانگی و میزان استفاده از داده است. بنابراین در طراحی توابع فاصله پیشنهادی ،از معیار نزدیکی داده ها به همدیگر،بر اساس مدل محرمانگی l-diversity استفاده شده،تا مصالحه بهتری محرمانگی و استفاده داده به وجود اید.روش پیشنهادی این مقاله،به صورت توزیع شده و با استفاده از برنامه نویسی RDD ها در چهارچوب آپاچی سپارک رائه شده است،تا چالش سرعت در اعملیات گمنام سازی داده های حجیم و مقیاس پذیری روش پیشنهادی را حل نمیاد در اخر پیاده سازی و آزمایشات انجام شده کارایی و مفید بودن روش پیشنهادی را نشان داده است

کلیدواژه ها

گمنام سازی،مدل k-anonymity ،مدلl-diversity ،خوشه بندی سلسله مراتبی،فاصله اقلیدس،فاصله منهتن

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.