CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

پردازش پایگاه داده ها و مقایسه بین روش های داده کاوی

عنوان مقاله: پردازش پایگاه داده ها و مقایسه بین روش های داده کاوی
شناسه ملی مقاله: INFM03_011
منتشر شده در سومین کنفرانس ملی ایده های نوین در فنی و مهندسی در سال 1398
مشخصات نویسندگان مقاله:

سجاد طالبی - دانشکده شهید چمران رشت

خلاصه مقاله:
پردازش پایگاه داده ها در بهره برداری از مصرف حافظه بسیار حایز اهمیت می باشد، متراکم سازی یکی ازابزار پیش پردازش ضروری برای کاستن از حافظه مورد نیاز برای ذخیره کردن و بارگذاری داده ها به منظور پردازشمی باشد ، روش متراکم سازی ارایه شده در این مقاله از طریق بکارگیری مثال های پیشنهاد شده مورد تست قرارگرفت تا تاثیر تکرار در پایگاه داده ها و همچنین اندازه پایگاه داده ها را نشان بدهد و نتایج مشخص نمودند که هروقت تکرار افزایش یافته است ، نسیت متراکم سازی افزایش خواهد یافت. متراکم سازی یکی از فعالیت های مهمبرای پیش پردازش داده ها قبل از اجرای داده کاوی می باشد . روش های داده کاوی نظیرNa¨ıve Bayes, Nearest neighbor و درختان تصمیم گیری مورد تست قرار می گیرند . اجرای سه روش نشان داد که روش Naïve Bayes به طور موثری درزمانی استفاده می شود که نشانه های داده ها دسته بندی می شوند و ان روش را می توان به طور موفقیت آمیزی در یادگیری ماشینی استفاده نمود. روش Nearest neighbor در زمانی بسیار مناسب می باشد که نشانه های داده ها دایمی هستند یا دسته بندی می شوند . درختان تصمیم گیری سومین روشی می باشدکه مورد تست قرار گرفت و این روش یک روش پیشگویانه ساده می باشد که از طریق بکارگیری روش های سادهقاعده در دسته بندی داده ها اجراء گردید. موفقیت اجرای داده کاوی به کامل بودن پایگاه داده ها بستگی دارد که ازطریق مخزن های داد ه ها نشان داده شدند که بایستی از طریق بکارگیری مشخصه های مهم مخزن داد ه هاسازماندهی گردند.

کلمات کلیدی:
داده کاوی ، پیش پردازش ، نزدیک ترین همسایگی، Naïve Bayers، درختان تصمیم

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/920011/