شناسایی هوشمند ناهنجاری در داده های صنعتی نامتوازن با استفاده از مدل XGBoost و الگوریتم ژنتیک (GA) جهت بهینه سازی عملکرد در شناسایی محصولات معیوب در خط تولید

رسول نعمت نیا; مریم خادمی; کیامرث فتحی; سهیلا سردار

شناسایی هوشمند ناهنجاری در داده های صنعتی نامتوازن با استفاده از مدل XGBoost و الگوریتم ژنتیک (GA) جهت بهینه سازی عملکرد در شناسایی محصولات معیوب در خط تولید

محل انتشار: مجله چشم انداز مدیریت صنعتی، دوره: 15، شماره: 3

سال انتشار: 1404

نوع سند: مقاله ژورنالی

زبان: فارسی

مشاهده: 24

فایل این مقاله در 25 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/2576808

شناسه ملی سند علمی:

JR_INDU-15-3_007

تاریخ نمایه سازی: 17 فروردین 1405

چکیده مقاله:

مقدمه و اهداف. فرآیند خطوط تولید و توالی آن یکی از رویکرد های اساسی در برنامه ریزی محصولات صنعتی به صورت انبوه است. عدم برنامه ریزی در خطوط و راه کار مناسب برای بهینهسازی سیستمهای موثر در فرآیند تولید و مونتاژ، باعث افزایش زمان تخصیصی به امر تولید و افزایش زمانهای توقف ماشین آلات و در نتیجه کاهش تعداد محصولات تولید از لحاظ تعدادی و نرخ تولید عدم کارایی منابع تخصیصی و در اختیار و در نتیجه افزایش هزینههای سیستم میشود که همه این عوامل در نهایت باعث بهره وری پایین و از دست دادن منابع موجود است. از این رو در این پژوهش هدف اصلی شناسایی ناهنجاری ها در فرآیند تولید ویفرهای نیمه هادی با استفاده از روش های یادگیری ماشین است. داده های مورد استفاده شامل ویژگی های مختلفی از ویفرهای تولیدی است که از یک تولید کننده بزرگ در صنعت نیمه هادی جمع آوری شده و حاوی اطلاعاتی از وضعیت ویفرها در فرآیند تولید است. به منظور بهبود عملکرد مدل و کاهش اثرات منفی داده های پرت، از روش وینزوریزه کردن برای تعدیل مقادیر بسیار دور از میانگین در برخی از ویژگی ها استفاده شد. همچنین، برای آماده سازی بهتر داده ها، ویژگی ها استاندارد سازی شدند تا مدل نسبت به تفاوت مقیاس بین ویژگی ها حساس نباشد. روش ها. در این پژوهش، با استفاده از روش های پیش پردازش داده و همچنین شبیه سازی در نرم افزار پایتون، سعی شد تا دقت مدل در شناسایی ناهنجاری ها افزایش یابد. اولین گام، آماده سازی داده ها و حذف یا تعدیل داده های پرت بود. به دلیل اینکه برخی از ویژگی ها شامل مقادیر بسیار و تعداد زیاد دور از میانگین بودند که می توانستند مدل را دچار انحراف کنند، از روش "وینزوریزه کردن" استفاده شد. وینزوریزه کردن به این معناست که مقادیر بسیار بزرگ و بسیار کوچک هر ویژگی به آستانه های معینی محدود می شوند تا تاثیر آن ها بر عملکرد مدل کاهش یابد. یکی دیگر از گام های کلیدی در این پروژه، کاهش ابعاد داده ها بود. با توجه به اینکه این مجموعه داده شامل ۱۵۵۸ ویژگی است، پردازش و تحلیل تمامی این ویژگی ها نیازمند منابع محاسباتی قابل توجهی است و ممکن است مدل را پیچیده تر از حد لازم کند. از این رو، با بهره گیری از روش "تحلیل تفکیک خطی (LDA) ، ابعاد داده ها به فضای بعد پایین تری کاهش یافت تا جدایی بهتری بین کلاس های نرمال و ناهنجار ایجاد شود. این کاهش ابعاد به مدل کمک می کند تا طبقه بندی داده ها را با دقت بیشتری انجام دهد و همچنین پردازش محاسباتی ساده تر شود. یافته ها. پس از آماده سازی داده ها، برای استانداردسازی دادهها ازجدول استاندارد آرایه های متعامد در روش تاگوچی استفاده میشود آرایه های متعامد L۹(۳۴) به عنوان مناسب ترین طرح برای مدلهای سه تا شش انتخاب میشوند. سپس داده ها مربوط به پژوهش با استفاده از مدل XGBoost و الگوریتم ژنتیک برای شناسایی ناهنجاری ها و مقایسه دو مدل استفاده شده است . عملکرد مدل با استفاده از ماتریس در هم ریختگی و منحنی ROC و کارائی الگوریتم ژنتیک مورد ارزیابی قرار گرفت. نتایج نشان داد که مدل توانایی بالایی در شناسایی ناهنجاری ها دارد و مقدار زیر منحنی AUC برابر با ۰.۹۷ به دست آمد. در ادامه، به منظور بهینه سازی بیشتر و مدیریت چالش عدم توازن داده -ها، از الگوریتم ژنتیک (GA) به عنوان یک رویکرد تکاملی برای تنظیم وزن ویژگی ها و آستانه طبقه بندی استفاده شد این نتایج نشان دهنده توانایی مدل در تفکیک نمونه های سالم و معیوب با دقت بالا است. این پژوهش نشان می دهد که با استفاده از تکنیک های مناسب پیش پردازش داده و مدل های یادگیری ماشین، می توان در شناسایی ناهنجاری های تولید و شناسایی قطعات معیوب به نتایج موفقیت آمیزی دست یافت و از ورود محصولات معیوب به بازار جلوگیری کرد. نتیجه گیری. نتایج به دست آمده از این تحقیق نشان داد که روش XGBoost توانایی بالایی در تشخیص ناهنجاری ها دارد.و همچنین الگوریتم ژنتیک توانسته است معیارهای عملکردی مانند دقت (۹۲.۴%)، ، فراخوانی (۰.۹۲۴) و امتیاز (۰.۹۱۳) را بهبود دهد و همگرایی پایداری در طول نسل های مختلف ارائه کند. ترکیب XGBoost و الگوریتم ژنتیک (GA) امکان شناسایی دقیق تر ناهنجاری ها را فراهم کرده و نشان می دهد که این رویکرد می تواند به عنوان یک چارچوب عملی در بهبود کنترل کیفیت، کاهش ضایعات و افزایش بهره وری خطوط تولید مورد استفاده قرار گیرد.

کلیدواژه ها:

ناهنجاری هوشمند ، مدل XGBoost ، صنعتی نامتعادل ، خط تولید ، محصولات معیوب ، الگوریتم ژنتیک

نویسندگان

رسول نعمت نیا

دانشجوی دکتری گروه مدیریت صنعتی، واحد تهران شمال، دانشگاه آزاد اسلامی، تهران، ایران.

مریم خادمی

دانشیار گروه ریاضی کاربردی، واحد تهران جنوب، دانشگاه آزاد اسلامی، تهران، ایران.

کیامرث فتحی

استادیار گروه مدیریت صنعتی، واحد تهران جنوب، دانشگاه آزاد اسلامی، تهران، ایران.

سهیلا سردار

استادیار گروه مدیریت صنعتی، واحد تهران شمال، دانشگاه آزاد اسلامی، تهران، ایران.

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

Antonini, M., Pincheira, M., Vecchio, M., & Antonelli, F. (۲۰۲۳). ...
Kamran, K., & Behnamian, J. (۲۰۲۳). Unrelated parallel machine scheduling ...
Liu, J. (۲۰۲۴). Predicting Chinese stock market using XGBoost multi-objective ...
Loh, C.-H., Chen, Y.-C., & Su, C.-T. (۲۰۲۴). Using transfer ...
Moslemipour, G., & Ghadirpour, S. M. (۲۰۲۱). Intelligent design of ...
Nguyen, H. D., Tran, K. P., Thomassey, S., & Hamad, ...
Sadeghi, H., Farughi, H., Kalevandi, F., & Solgi, M. (۲۰۲۳). ...
Yang, S., Feng, M., & Guan, D. (۲۰۲۲). Intelligent scheduling ...
Srinath, K. R. (۲۰۱۷). Python—the fastest growing programming language. International ...
Soller, S., Kranz, M., & Hoelzl, G. (۲۰۲۰). Adaptive error ...

نمایش کامل مراجع