انتخاب بهینه ترین K برای دیتاست های موجود با استفاده از MLP-KFOLD

حسن سهراب پور; مسعود پورمرادی; مقداد میردار موسی پور

انتخاب بهینه ترین K برای دیتاست های موجود با استفاده از MLP-KFOLD

محل انتشار: ششمین کنگره بین المللی توسعه و ترویج علوم و فنون بنیادین در جامعه

سال انتشار: 1397

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 443

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/916990

شناسه ملی سند علمی:

DPFSTS06_249

تاریخ نمایه سازی: 6 شهریور 1398

چکیده مقاله:

پیشرفت روز افزون تکنولوژی های جمع آوری اطلاعات و امکان دسترسی به حجم عظیمی از داده همواره نیازمند روش هایی برای تجزیه و تحلیل این حجم داده خام و استخراج اطلاعات مفید از آن می باشیم. امروزه خوشه بندی داده به عنوان یکی از روش های آنالیز و ساده سازی مجموعه داده های بزرگ، مورد توجه بسیاری از محققین قرار گرفته است. در این مقاله با استفاده از MLP-KFOLD داده ها مورد نظر را به تعداد K، که انتخاب K هم به اندازه تعداد داده های موجود یا همان دیتاست بستگی دارد. این نوع اعتبارسنجی داده ها به K زیرمجموعه افراز می شوند. از این K زیرمجموعه، هر بار یکی برای اعتبارسنجی و K-1 تای دیگر برای آموزش بکار می روند. این روال K بار تکرار می شود و همه داده ها دقیقا یکبار برای آموزش و یکبار برای اعتبارسنجی بکار می روند. در نهایت میانگین نتیجه این K بار اعتبارسنجی به عنوان یک تخمین نهایی برگزیده می شود. در روش K-Fold سعی می شود نسبت داده ای هر کلاس در هر زیرمجموعه و در مجموعه اصلی یکسان باشد.

کلیدواژه ها:

اعتبارسنجی ، خوشه بندی ، کلاسترینگ ، دسته بندی ، K-Fold

نویسندگان

حسن سهراب پور

دانشکده سما چالوس ، چالوس

مسعود پورمرادی

دانشکده سما چالوس ، چالوس

مقداد میردار موسی پور

دانشگاه پویندگان، چالوس