بهبود امنیت و حفظ حریم خصوصی در داده کاوی با استفاده از ترکیب روش های تبدیل داده

  • سال انتشار: 1396
  • محل انتشار: پنجمین کنفرانس بین المللی مهندسی برق و کامپیوتر با تاکید بر دانش بومی
  • کد COI اختصاصی: COMCONF05_714
  • زبان مقاله: فارسی
  • تعداد مشاهده: 645
دانلود فایل این مقاله

نویسندگان

پرنیان شمس

گروه مهندسی برق و کامپیوتر، دانشگاه صفاشهر ، دانشگاه آزاد اسلامی ، صفاشهر ، ایران

محسن کاتبی جهرمی

گروه برق و کامپیوتر ، واحد صفاشهر ، دانشگاه آزاد اسلامی ، صفاشهر، ایران

چکیده

داده های تولید شده در چند سال اخیر با کل داده های تولید شده در تاریخ بشر تقریبا برابر است. داده کاوی به عنوان یک راه حل مفید جهت تحلیل داده و استخراج الگو و دانش از داده های حجیم، بی نظم و پراکنده در حال گسترش است در عین حال، حفظ حریم خصوصی داده و امنیت اطلاعات حساس طی فرآیند داده کاوی به عنوان یک چالش بسیارمهم مطرح است. حریم خصوصی را میتوان با پنهان کردن اطلاعات حساس فراهم کرد، اما این کار بر استخراج دانش از طریق الگوریتم های داده کاوی تاثیر میگذارد. بنابراین به راه حلی نیاز است که حریم خصوصی دادهها را حفظ کرده و در عین حال بر عملکرد و نتایج الگوریتم های داده کاوی بی تاثیر باشد. در این مقاله، ما به مسیله تبدیل یک پایگاه داده به پایگاه داده جدیدی می پردازیم که در حالیکه الگوها و روند کلی پایگاه داده اصلی را حفظ میکند اطلاعات حساس را مخفی نگه می دارد. بدین منظور یک روش تبدیل داده مبتنی بر تبدیل موجک گسسته سه سطحی پیشنهاد کرده ایم که دارای یک مقدار آستانه متفاوت در هر سطح است. ماتریس داده جدید سودمندی داده ها را حفظ و از حریم خصوصی محافظت میکند، همچنین از حدس زدن مقدار اصلی ویژگیها از طریق ماتریس تحریف شده نیز جلوگیری می نماید. آزمایشها نشان میدهد روش پیشنهادی در حالی که از اطلاعات حساس حفاظت مینماید نتایج معتبر داده کاوی را نیز تضمین میکند.

کلیدواژه ها

حفظ حریم خصوصی در داده کاوی، کاهش بعد، تبدیل موجک سه سطحی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.