کاوش قوانین انجمنی در اسناد XML با روش شاخص جدولی بهینه شده
محل انتشار: دومین کنفرانس داده کاوی ایران
سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,639
فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
IDMC02_070
تاریخ نمایه سازی: 14 فروردین 1388
چکیده مقاله:
استفاده از اسناد XML، بعنوان یک استاندارد جهانی، در پایگاه داده ها روز به روز در حال افزایش است. از اینرو روابط موجود بین داده های XML بعنوان یک چالش عمده مطرح و نیاز به استخراج دانش از داده های خام جهت افزایش هوش سازمانی کاملا محسوس است. روش شاخص جدولی بعنوان یک روش در این راستا مطرح است. در این مقاله راهکاری جهت بهبود این روش ارائه شده است که هم از نظر فرآیند کاوش و هم از نظر زمان استخراج اطلاعات، روش نامر برده را بهبود بخشیده است. روش شاخص جدولی قوانین رااز محتویات XML بدون اطلاع از روابط مورد نظر کاربر استخراج کرده و به کاوش قوانین ناشناخته، بروی اسناد با ساختارهای مشابه می پردازد. در حالیکه در روش ارائه شده در این مقاله بدون اینکه اطلاعی از ساختار اسناد در دسترس باشد می توان به کشف قوانین ناشناخته پرداخت، برای این منظور در ابتدا داده های خام را از اسناد XML استخراج و براساس ساختار درختی آن، جدول رابطه ای مشتمل بر تراکنشها و آیتمها لیست شده و سپس به روش کاوش قوانین انجمنی، قوانین معتبر بدست آمده و دانش مورد نیاز آن روی آن قوانینی بدست می آید.
کلیدواژه ها: