کاوش قوانین انجمنی در اسناد XML با روش شاخص جدولی بهینه شده

سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,639

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IDMC02_070

تاریخ نمایه سازی: 14 فروردین 1388

چکیده مقاله:

استفاده از اسناد XML، بعنوان یک استاندارد جهانی، در پایگاه داده ها روز به روز در حال افزایش است. از اینرو روابط موجود بین داده های XML بعنوان یک چالش عمده مطرح و نیاز به استخراج دانش از داده های خام جهت افزایش هوش سازمانی کاملا محسوس است. روش شاخص جدولی بعنوان یک روش در این راستا مطرح است. در این مقاله راهکاری جهت بهبود این روش ارائه شده است که هم از نظر فرآیند کاوش و هم از نظر زمان استخراج اطلاعات، روش نامر برده را بهبود بخشیده است. روش شاخص جدولی قوانین رااز محتویات XML بدون اطلاع از روابط مورد نظر کاربر استخراج کرده و به کاوش قوانین ناشناخته، بروی اسناد با ساختارهای مشابه می پردازد. در حالیکه در روش ارائه شده در این مقاله بدون اینکه اطلاعی از ساختار اسناد در دسترس باشد می توان به کشف قوانین ناشناخته پرداخت، برای این منظور در ابتدا داده های خام را از اسناد XML استخراج و براساس ساختار درختی آن، جدول رابطه ای مشتمل بر تراکنشها و آیتمها لیست شده و سپس به روش کاوش قوانین انجمنی، قوانین معتبر بدست آمده و دانش مورد نیاز آن روی آن قوانینی بدست می آید.