بهبودبهره وری فرآیند تشخیص تکراربه هنگام یکپارچه سازی پایگاه داده ها بااستفاده ازیادگیری نظارتی
سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 852
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
BPJ01_448
تاریخ نمایه سازی: 29 دی 1392
چکیده مقاله:
یکی ازگامهای مهم درافزایش تعداد پروژه های داده کاوی پیوند پایگاه داده می باشد زیراباپیوند داده ها اطلاعاتی را که دردسترس نیست میتوان به دست اورد درغیر این صورت برای جمع اوری داده های خاص زمان و هزینه زیادی باید صرف کرد یکی ازچالشهای بزرگ به هنگام پیوند پایگاه داده های بزرگ تطبیق و طبقه بندی رکوردهایی است که به موجودیت یکسانی اشاره دارند درزندگی واقعی پایگاه داده ها متشکل ازرکوردهایی هستند که آنها نیز به نوبه خود ترکیبی ازفیلدها میب اشند که مسئله تشخیص تکرار را پیچیده تر کرده است بنابراین بررسی روشهایی که برای تطبیق رکوردها بافیلدهای مختلف استفاده میشود نیز امری ضروری است ازاین رورویکردهایی که برروش های نظارت بریادگیری ماشین برای تطبیق رکوردها تکیه دارند مورد بررسی قرارگرفته است بسیاری ازروشهای طبقه بندی که امروزه توسعه یافته اند براساس تکنیکهای یادگیری بانظارت می باشد دراین مقاله برای شناسایی تکرار به بررسی چندین الگوریتم مبتنی بریادگیری نظارتی پرداخته ایم باتوجه به معیارهای ارزیابی تعریف شده عملکردتمامی الگوریتم های مذکور مورد بررسی قرارگرفته است باتوجه به اینکه F-measure طبقه بندی sVM برروی مجموعه داده Restaurent ازهمه الگوریتم های مذکوربیشتر است درنتیجه دارای کارایی بهتری میباشد
کلیدواژه ها:
نویسندگان
رعنا موسی زاده
دانشجوی کارشناسی ارشدنرم افزار
علی فرزان
عضوهیئت علمی دانشگاه آزاد اسلامی واحد شبستر
جعفر احمدی شالی
عضو هیئت علمی دانشگاه تبریز
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :