ارائه روشی برای تشخیص رکوردهای مشابه درپایگاه داده های بزرگ با استفاده ازشبکه عصبی

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,434

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

BPJ01_613

تاریخ نمایه سازی: 29 دی 1392

چکیده مقاله:

پایگاه داده های بزرگ معمولا شامل رکوردهایی است که به یک موجودیت یکسان اشاره دارند استفاده ازاختصارسامانه های متنوع سازمانی تجمیع داده منابع مختلف دلایلی هستند که منجر به رکوردهای تکراری درپایگاه داده می گردند این مساله بخاطراینکه تاثیرمخربی براماروگزارشات و نتایج داده کاوی ازپایگاه داده ها می گذرد بسیارمهم است دراین مقاله راه حل جدیدی برای تشخیص رکوردهای مشابه درپایگاه داده های بزرگ با استفاده ازشبکه عصبی mlp ارایه شده است نتایج ارزیابی نشان میدهد درصورتی که شبکه عصبی با داده های مناسب اموزش ببیند عملکردخوبی نسبت به روشهای قبلی دارد این روش بصورت ماژولی جهت تشخیص تکرارها برای سیستم های برخط بزرگ مانندموتورهای جستجوقابل استفاده است

نویسندگان

بهراد دهقانی

دانشجوی کارشناسی ارشد

محمدرضا حسنی آهنگر

استادیاردانشگاه جامع امام حسین ع

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • P. Paskalev, A. Antonov, "Intelligent application for duplication detection". In ...
  • Gusfield "Algorithms on strings, trees and sequences". Cambridge Univ. Press, ...
  • Bilenko M., Mooney R. "Adaptive duplicate detection using learnable string ...
  • Washington DC, pp.39-48, August, 2003 ...
  • Needleman S B. and Wunsch , D. "A general method ...
  • Hernandez M A. and Stolf S. J. "The merge/purge SIGMOD, ...
  • Sander C. and Schneider R., "Database of homology- derived protein ...
  • I. Fellegi and A. Sunter. _ theory for record linkage ...
  • linkage". KDD-2004 Workshop on Multi-R elational Data Mining (pp. 31-48), ...
  • architectures, algorithms and applications". Prentice Hall, 1994, ISBN:)133341860 ...
  • M. Young, _ Technical Writer's Handbook2. Mill Valley, CA: University ...
  • Lionel Tarassenko, _ Guide to Neural Computing ISBN: ...
  • Barbara D. Klein and Donald F Rossin "Data errors in ...
  • Leslie Smith, _ Introduction to Neural Networks", http ://www. cs ...
  • نمایش کامل مراجع