اتصال رکوردی با روش های یادگیری ماشین
محل انتشار: مجله علوم آماری، دوره: 16، شماره: 1
سال انتشار: 1401
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 216
فایل این مقاله در 24 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_STAT-16-1_001
تاریخ نمایه سازی: 23 شهریور 1401
چکیده مقاله:
با ظهور مه داده ها در دو دهه گذشته، به منظور بهره برداری و استفاده از این نوع داده ها، نیاز به یکپارچه سازی پایگاه داده ها با هدف تصمیم گیری براساس شواهد و اطلاعات قوی تر، بیش از پیش احساس می شود. لذا آشنایی با روش شناسی اتصال رکوردی به عنوان یکی از روش های یکپارچه سازی داده ها و همچنین استفاده از روش های یادگیری ماشین برای سهولت فرآیند اتصال رکوردها ضروری است. در این مقاله، ضمن تشریح فرایند اتصال رکوردی و برخی روش های مرتبط با آن، با استفاده از روش های یادگیری ماشین، برای افزایش سرعت یکپارچه سازی پایگاه داده ها، کاهش هزینه و بهبود عملکرد اتصال رکوردی، دو پایگاه داده چارچوب کارگاه های صنعتی مرکز آمار ایران و سازمان تامین اجتماعی به یکدیگر متصل شده اند.
کلیدواژه ها:
Record Linkage ، Machine Learning ، Fellegi-Sunter Model ، Jaro and Winkler String Comparison ، Official Statistics. ، اتصال رکوردی ، یادگیری ماشین ، مدل فلگی-سانتر ، مقایسات زوجی جارو و وینکلر ، آمار رسمی.
نویسندگان
زهرا رضائی قهرودی
School of Mathematics, Statistics and Computer Science, University of Tehran, Tehran, Iran.
ژینا آقامحمدی
School of Mathematics, Statistics and Computer Science, University of Tehran, Tehran, Iran.
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :