تصحیح خودکار داده ها مبتنی بر وابستگی تابعی و سیستم یادگیری مرکب
سال انتشار: 1397
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 447
فایل این مقاله در 18 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_TJEE-48-2_029
تاریخ نمایه سازی: 17 تیر 1398
چکیده مقاله:
صحت داده ها یکی از مهم ترین ابعاد کیفیت داده ها به شمارمی رود. با توجه به حجم بالای منابع داده ای نیاز به روش هایی خودکار وجود دارد. در این مقاله راهکاری خودکار برای تصحیح داده هایی با انواع داده ای متفاوت ارائه شده است. در این راهکار در ابتدا رکوردهایی که احتمالا حاوی ویژگی خطا است با استفاده از وابستگی تابعی شناسایی می گردد، بدین صورت که رکوردی که به ازای یک وابستگی تابعی با بیش از از رکوردها در تناقض باشد، مشکوک به خطا است. سپس به ازای هر ویژگی از منبع داده مورد بررسی، سیستم یادگیری مرکب ساخته می شود. سیستم یادگیری مرکب از سه طبقه بند بیز، درخت تصمیم و شبکه عصبی MLP تشکیل شده است و دارای استراتژی ترکیب رای اکثریت است. سیستم یادگیری مرکب به وسیله رکوردهای صحیح شناسایی شده مورد آموزش قرارداده می شود. پس از آموزش طبقه بندها، هر ویژگی غلط به عنوان کلاس هدف سیستم یادگیری مرکب قرارمی گیرد و مقداری برای آن پیش بینی می گردد. روش پیشنهادی قادراست چندین خطا در یک رکورد را شناسایی نماید. آزمایش ها نشان می دهد که true negative rate الگوریتم پیشنهادی در بخش تشخیص خطا به طور متوسط 93.7% و در بخش تصحیح خطا به طور متوسط 90.6% است. هم چنین آزمایش ها نشان می دهد که میزان پارامترهای ارزیابی در الگوریتم پیشنهادی در مقایسه با دو الگوریتم مشابه مبتنی بر وابستگی تابعی بهبود داشته است.
کلیدواژه ها:
نویسندگان
مهدیه عطاییان
تهران - دانشگاه تربیت دبیر شهید رجایی - دانشکده مهندسی کامپیوتر
نگین دانشپور
تهران - دانشگاه تربیت دبیر شهید رجایی - دانشکده مهندسی کامپیوتر
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :