بررسی روشهای مطرح شده درفازهای تطبیق فیلد برای تشخیص داده های تکراری دریکپارچه سازی اطلاعات

سال انتشار: 1391
محل انتشار: اولین همایش ملی فناوری اطلاعات و شبکه های کامپیوتری دانشگاه پیام نور
کد COI اختصاصی: PNUNCIT01_110
زبان مقاله: فارسی
تعداد مشاهده: 734

نویسندگان

دانشگاه آزاد اسلامی واحد شبستر

دانشگاه تبریز

چکیده

باتوجه به اینکه پایگاه داده ها نقش مهمی را درفناوری های مبتنی براقتصاد بازی می کنند بسیاری ازصنایع و سیستم ها برای انجام عملیاتشان به صحت و دقت پایگاه داده ها وابسته اند بنابراین کیفیت اطلاعات ذخیره شده درپایگاه داده ها برای سیستمی که برپایه آن اطلاعات به کسب و کارمی پردازد هزینه ها و پیامدهای قابل توجهی می تواندداشته باشد ازطرفیدربرخی موارد یکپارچه سازی چندین پایگاه داده با نمایش های داده ای متفاوت نیز به نوبه خود برمیزان کاهش دقت داده خواهد افزود وجود رکوردهای تکراری یکی ازمواردی است که مخصوصا درراستای یکپارچه سازی پایگاه داده منجر به کاهش دقت داده و به دنبال آن کاهش میزان صحت اطلاعات اماری استننتاج شده ازآنها خواهد شد ازاین رو جهت تشخیص تکرار داده انواع تکنیکهای تطابق فیلد مبتنی برکاراکتر TOKEN و روشهای ترکیبی مطرح شدها ست که هردسته دارای الگوریتم های مختلفی میباشد دراین مقاله تمامی الگوریتم های مذکور مورد بررسی و ارزیابی قرار داده شده است

کلیدواژه ها

پایگاه داده، رکوردتکراری، تطابق فیلد، تشخیص تکرار

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.