تحلیل شدت تصادفات جاده ای ایران با ارائه یک رویکرد یکپارچه پیش پردازش داده ها مبتنی بر الگوریتم های یادگیری ماشین

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 358

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICSAU09_574

تاریخ نمایه سازی: 24 فروردین 1403

چکیده مقاله:

با وجود اهمیت پیش پردازش داده ها در اعتبار نتایج مدلهای تحلیل شدت تصادفات، این مهم اغلب مورد بی توجهی قرار گرفته است . هدف این پژوهش ارائه یک رویکرد پیش پردازش یکپارچه جهت شناسایی مهمترین عوامل موثر بر شدت تصادفات جاده ای ایران طی سالهای ۱۳۹۳-۱۳۹۷ است . پس از تجمیع داده ها، نمونه ای از کلان داده به روش نمونه برداری خوشه ای تصادفی انتخاب شد. این شیوه نمونه برداری ، توزیع داده ها را حفظ کرده و از سوگیری نتایج جلوگیری می کند. سپس ، داده های پرت شناسایی و به عنوان داده های گمشده معرفی شدند. متغیر های پیوسته با روش گسسته سازی مبتنی بر کمینه سازی آنتروپی به متغیر رسته ای تبدیل شدند. با استفاده از مدل یادگیری ماشین کا-نزدیکترین همسایه با میانگین وزن دار، از طریق یادگیری الگوی موجود در داده ها، مقادیر گمشده با محتمل ترین مقادیر جایگزین شدند. با روشهای نمونه برداری مصنوعی بیشتر از کلاس اقلیت (SMOTE) و نمونه برداری کمتر از کلاس اکثریت ، با مساله عدم توازن در داده ها برخورد شد. سپس ، با الگوریتم جنگل تصادفی متغیرهای کم اهمیت شناسایی و حذف شدند. مدل شدت تصادف درخت تصمیم ، بدون پیش پردازش عدم توازن، دقتی معادل ۵۹ % دارد؛ درحالیکه شاخص دقت میانگین -جی در این حالت معادل ۰% است . در مقابل ، شاخصهای دقت میانگین -جی و دقت برای مدل با داده های اصلاحی به روش نمونه برداری مصنوعی بیشتر از کلاس اقلیت ، به ترتیب معادل ۶۹% و ۶۸% است . به خصوص، شایان توجه است که دقت پیش بینی تصادفات فوتی در مدل اصلاح نشده کمتر از ۱% است . این درحالیست که دقت پیش بینی تصادفات فوتی در مدل اصلاحی ۶۷% است . این نتایج به روشنی اهمیت توجه به عدم توزن در داده ها را در مرحله پیش پردازش نشان می دهند.

نویسندگان

سیدایمان محمدپور

دانشجوی دکتری مهندسی عمران، دانشگاه صنعتی شریف

ابوالفضل محمدزاده مقدم

دانشیار دانشکده مهندسی، دانشگاه فردوسی مشهد