بکارگیری تکنیکی از داده کاوی برای بهبود کارآیی سیستم های استخراج اطلاعات از متن

سال انتشار: 1384
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,242

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICIKT02_003

تاریخ نمایه سازی: 12 دی 1386

چکیده مقاله:

با رشد سریع حجم متون قابل دسترس به خصوص در شبکه ی جهانی اینترنت کار استخراج اطلاعات از متن اهمیت ویژه ای یافته است. خروجی سیستم استخراج اطلاعات، پایگاه داده ای از اطلعات موجود در متن می باشد. از طرفی تکنیک های داده کاوی این امکان را به ما می دهند که دانشی را به شکل مجموعه ای از قواعد از محتویات پایگاه داده و ارتباط بین آنها بدست آوریم. در این مقاله از تکنیک تولید قواعد تداعی گر در داده کاوی استفاده می کنیم. بدین منظور با استفاده از الگوریتم استاندارد C4.5RULES و اعمال ان بر روی خروجی سیستم استخراج اطلاعات، دانشی (مجموعه ی قواعد پیشگو) بدست می آوریم که از ان برای بالاتر بودن احتمال درستی اطلاعات استخراج شده، پیشگویی اطلاعات استخراج نشده و مقایسه بین قواعد استخراج اطلاعات استفاده می کنیم. در ادامه، طرحی برای معماری سیستم های استخراج اطلاعات پیشنهاد می کنیم تا بتوانند از این تکنیک برای بهبود کارایی شان استفاده کنند. سپس نتایج پیاده سازی این تکنیک را بر روی سیستم WHISK (یکی از سیستم های باز استخراج اطلاعات موجود) مورد ارزیابی قرار می دهیم.

کلیدواژه ها:

استخراج اطلاعات از متن ، داده کاوی ، وب کاوی ، استخراج دانش از پایگاه داده ، معماری سیستم های استخراج اطلاعات از متن

نویسندگان

احمد عبداله زاده

دانشیار، هیئت علمی دانشکده کامپیوتر دانشگاه صنعتی امیرکبیر - دانشکده

مجتبی شکری

کارشناسی ارشد نرم افزار دانشگاه صنعتی امیرکبیر، هیئت علمی دانشگاه آز

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • ا. عبداله زاده، و م. شکری. روشهای مهندسی _ و ...
  • S. Soderland, Learning Information Extraction Rules for Semi- Structured and ...
  • DARPA., ed. Proceedings of the Fifth DARPA Message Understandi ng ...
  • C. Cardie, and R. J. Mooney, Machine learning and natural ...
  • J. R. Quinlan, C4.5: Programs for Machine Learning, San Mateo, ...
  • F. Peng, Models Development in IE Tasks, CS685 Project, Computer ...
  • M. E. Callif, and R. J. Mooney, Relational learning of ...
  • H. Ahone n-myka, Information Extraction from text, Information Extraction Course ...
  • N. Kushmerick, D. Weld, and R. Doorenbos, Wrapper induction for ...
  • M. Holsheimer, M. Kerstenm, H. Mannila, and H. Toivonen, A ...
  • G. J. Williams, and Z. Huang, Modeling the KDD Process, ...
  • R. Agrawal, and R. Sirkant, Fast algorithms for mining association ...
  • R. Feldman, and I. Dagan, Knowledge discovery in textual database ...
  • E. S. Ristad, and P. N. Yianilos, Learning string edit ...
  • M. Hearst, Untangling text data mining, In Proceedings of the ...
  • نمایش کامل مراجع