بهبودبهره وری فرآیند تشخیص تکراربه هنگام یکپارچه سازی پایگاه داده ها بااستفاده ازیادگیری نظارتی

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 852

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

BPJ01_448

تاریخ نمایه سازی: 29 دی 1392

چکیده مقاله:

یکی ازگامهای مهم درافزایش تعداد پروژه های داده کاوی پیوند پایگاه داده می باشد زیراباپیوند داده ها اطلاعاتی را که دردسترس نیست میتوان به دست اورد درغیر این صورت برای جمع اوری داده های خاص زمان و هزینه زیادی باید صرف کرد یکی ازچالشهای بزرگ به هنگام پیوند پایگاه داده های بزرگ تطبیق و طبقه بندی رکوردهایی است که به موجودیت یکسانی اشاره دارند درزندگی واقعی پایگاه داده ها متشکل ازرکوردهایی هستند که آنها نیز به نوبه خود ترکیبی ازفیلدها میب اشند که مسئله تشخیص تکرار را پیچیده تر کرده است بنابراین بررسی روشهایی که برای تطبیق رکوردها بافیلدهای مختلف استفاده میشود نیز امری ضروری است ازاین رورویکردهایی که برروش های نظارت بریادگیری ماشین برای تطبیق رکوردها تکیه دارند مورد بررسی قرارگرفته است بسیاری ازروشهای طبقه بندی که امروزه توسعه یافته اند براساس تکنیکهای یادگیری بانظارت می باشد دراین مقاله برای شناسایی تکرار به بررسی چندین الگوریتم مبتنی بریادگیری نظارتی پرداخته ایم باتوجه به معیارهای ارزیابی تعریف شده عملکردتمامی الگوریتم های مذکور مورد بررسی قرارگرفته است باتوجه به اینکه F-measure طبقه بندی sVM برروی مجموعه داده Restaurent ازهمه الگوریتم های مذکوربیشتر است درنتیجه دارای کارایی بهتری میباشد

نویسندگان

رعنا موسی زاده

دانشجوی کارشناسی ارشدنرم افزار

علی فرزان

عضوهیئت علمی دانشگاه آزاد اسلامی واحد شبستر

جعفر احمدی شالی

عضو هیئت علمی دانشگاه تبریز

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • K.Ahmed and G.Panagiotis and S.Vassilios, "Duplicate Record Detection: A Survey", ...
  • Muazzam. Siddiqui, "High Performance Data Mining Techniques For Intrusion Detection", ...
  • Nitin.Bhatia and Vandana, "Survey of Nearest Neighbor Techniques", (IJCSIS) International ...
  • Yang, Yiming., _ evaluation of statistical approaches to text categorization' ...
  • Shirazi, M. Hossein, " Anomaly Intrusion Detection System Using Information ...
  • Maheshkumar Sabhnani, "Application of Machine Learning Algorithms to KDD Intrusion ...
  • Machine Learning: Models, Technologies, and Applications, pp: 209-215, 2003. ...
  • Record Linkage using Automatic:ه [7] Peter. Christen, Seeded Nearest Neighbour ...
  • M ohammadreza Ektefa and Fatima. Sidi and Hamidah. Ibrahim, Marzanah ...
  • "Adaptive Duplicate Detection Using Learnable String Similarity Measures", Proceedings of ...
  • S. Hemalatha and K. Raja and Arasu. Tholkappia, "Duplicate Detection ...
  • Cyju. Elizabeth Varghese and G.Naveen Sundar, "Record Matching : Improving ...
  • Xiaochun. Yang and Bin. Wang, Guoren.Wang and Ge.Yu, RSEARCH: "Enhancing ...
  • Heiko. Muller and Johann Christoph. Freytag, in ...
  • Comprehensive Data Cleansing", HUB-IB-164, Humboldt University Berlin, 2003. ...
  • Professor Mikolaj. Leszczuk, "Approximate string matching algorithms in art media ...
  • Patrick. Lehti, "Unsupervised Duplicate Detection Using Sample Non-Dup licates? , ...
  • "Learning to Combine Trained Distance Metrics for Duplicate Detection in ...
  • Steven. Mascaro and Kevin B Korb and Ann E. Nicholson, ...
  • Joyce. Jackson, "Data Mining: A Conceptual Overvie, C _ mmunications ...
  • نمایش کامل مراجع