انتخاب بهینه ترین K برای دیتاست های موجود با استفاده از MLP-KFOLD

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 443

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

DPFSTS06_249

تاریخ نمایه سازی: 6 شهریور 1398

چکیده مقاله:

پیشرفت روز افزون تکنولوژی های جمع آوری اطلاعات و امکان دسترسی به حجم عظیمی از داده همواره نیازمند روش هایی برای تجزیه و تحلیل این حجم داده خام و استخراج اطلاعات مفید از آن می باشیم. امروزه خوشه بندی داده به عنوان یکی از روش های آنالیز و ساده سازی مجموعه داده های بزرگ، مورد توجه بسیاری از محققین قرار گرفته است. در این مقاله با استفاده از MLP-KFOLD داده ها مورد نظر را به تعداد K، که انتخاب K هم به اندازه تعداد داده های موجود یا همان دیتاست بستگی دارد. این نوع اعتبارسنجی داده ها به K زیرمجموعه افراز می شوند. از این K زیرمجموعه، هر بار یکی برای اعتبارسنجی و K-1 تای دیگر برای آموزش بکار می روند. این روال K بار تکرار می شود و همه داده ها دقیقا یکبار برای آموزش و یکبار برای اعتبارسنجی بکار می روند. در نهایت میانگین نتیجه این K بار اعتبارسنجی به عنوان یک تخمین نهایی برگزیده می شود. در روش K-Fold سعی می شود نسبت داده ای هر کلاس در هر زیرمجموعه و در مجموعه اصلی یکسان باشد.

نویسندگان

حسن سهراب پور

دانشکده سما چالوس ، چالوس

مسعود پورمرادی

دانشکده سما چالوس ، چالوس

مقداد میردار موسی پور

دانشگاه پویندگان، چالوس