شناسایی هوشمند ناهنجاری در داده های صنعتی نامتوازن با استفاده از مدل XGBoost و الگوریتم ژنتیک (GA) جهت بهینه سازی عملکرد در شناسایی محصولات معیوب در خط تولید

سال انتشار: 1404
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 24

فایل این مقاله در 25 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_INDU-15-3_007

تاریخ نمایه سازی: 17 فروردین 1405

چکیده مقاله:

مقدمه و اهداف. فرآیند خطوط تولید و توالی آن یکی از رویکرد های اساسی در برنامه ریزی محصولات صنعتی به صورت انبوه است. عدم برنامه ریزی در خطوط و راه کار مناسب برای بهینه­سازی سیستم­های موثر در فرآیند تولید و مونتاژ، باعث افزایش زمان تخصیصی به امر تولید و افزایش زمان­های توقف ماشین آلات و در نتیجه کاهش تعداد محصولات تولید از لحاظ تعدادی و نرخ تولید عدم کارایی منابع تخصیصی و در اختیار و در نتیجه افزایش هزینه­های سیستم می­شود که همه این عوامل در نهایت باعث بهره وری پایین و از دست دادن منابع موجود است. از این رو در این پژوهش هدف اصلی شناسایی ناهنجاری­ ها در فرآیند تولید ویفر­های نیمه هادی با استفاده از روش­ های یادگیری ماشین است. داده ­های مورد استفاده شامل ویژگی­ های مختلفی از ویفر­های تولیدی است که از یک تولید کننده بزرگ در صنعت نیمه هادی جمع آوری شده و حاوی اطلاعاتی از وضعیت ویفرها در فرآیند تولید است. به منظور بهبود عملکرد مدل و کاهش اثرات منفی داده ­های پرت، از روش وینزوریزه کردن برای تعدیل مقادیر بسیار دور از میانگین در برخی از ویژگی­ ها استفاده شد. همچنین، برای آماده سازی بهتر داده­ ها، ویژگی­ ها استاندارد سازی شدند تا مدل نسبت به تفاوت مقیاس بین ویژگی­ ها حساس نباشد. روش ها. در این پژوهش، با استفاده از روش­ های پیش پردازش داده و همچنین شبیه سازی در نرم افزار پایتون، سعی شد تا دقت مدل در شناسایی ناهنجاری­ ها افزایش یابد. اولین گام، آماده سازی داده ­ها و حذف یا تعدیل داده ­های پرت بود. به دلیل اینکه برخی از ویژگی­ ها شامل مقادیر بسیار و تعداد زیاد دور از میانگین بودند که می­ توانستند مدل را دچار انحراف کنند، از روش "وینزوریزه کردن" استفاده شد. وینزوریزه کردن به این معناست که مقادیر بسیار بزرگ و بسیار کوچک هر ویژگی به آستانه­ های معینی محدود می­ شوند تا تاثیر آن ها بر عملکرد مدل کاهش یابد. یکی دیگر از گام­ های کلیدی در این پروژه، کاهش ابعاد داده­ ها بود. با توجه به اینکه این مجموعه داده شامل ۱۵۵۸ ویژگی است، پردازش و تحلیل تمامی این ویژگی­ ها نیازمند منابع محاسباتی قابل توجهی است و ممکن است مدل را پیچیده تر از حد لازم کند. از این رو، با بهره گیری از روش "تحلیل تفکیک خطی (LDA) ، ابعاد داده ­ها به فضای بعد پایین ­تری کاهش یافت تا جدایی بهتری بین کلاس­ های نرمال و ناهنجار ایجاد شود. این کاهش ابعاد به مدل کمک می­ کند تا طبقه بندی داده­ ها را با دقت بیشتری انجام دهد و همچنین پردازش محاسباتی ساده تر شود. یافته ها. پس از آماده ­سازی داده­ ها، برای استانداردسازی داده­ها ازجدول استاندارد آرایه­ های متعامد در روش تاگوچی استفاده می­شود آرایه ­های متعامد L۹(۳۴) به عنوان مناسب ترین طرح برای مدل­های سه تا شش انتخاب می­شوند. سپس داده ها مربوط به پژوهش با استفاده از مدل XGBoost و الگوریتم ژنتیک برای شناسایی ناهنجاری­ ها و مقایسه دو مدل استفاده شده است . عملکرد مدل با استفاده از ماتریس در هم ریختگی و منحنی ROC  و کارائی الگوریتم ژنتیک مورد ارزیابی قرار گرفت. نتایج نشان داد که مدل توانایی بالایی در شناسایی ناهنجاری ها دارد و مقدار زیر منحنی AUC برابر با ۰.۹۷ به دست آمد. در ادامه، به منظور بهینه سازی بیشتر و مدیریت چالش عدم توازن داده -ها، از الگوریتم ژنتیک (GA) به عنوان یک رویکرد تکاملی برای تنظیم وزن ویژگی­ ها و آستانه طبقه بندی استفاده شد این نتایج نشان دهنده توانایی مدل در تفکیک نمونه ­های سالم و معیوب با دقت بالا است. این پژوهش نشان می­ دهد که با استفاده از تکنیک­ های مناسب پیش پردازش داده و مدل­ های یادگیری ماشین، می­ توان در شناسایی ناهنجاری ­های تولید و شناسایی قطعات معیوب به نتایج موفقیت آمیزی دست یافت و از ورود محصولات معیوب به بازار جلوگیری کرد. نتیجه گیری. نتایج به دست آمده از این تحقیق نشان داد که روش XGBoost توانایی بالایی در تشخیص ناهنجاری­ ها دارد.و همچنین الگوریتم ژنتیک توانسته است معیارهای عملکردی مانند دقت (۹۲.۴%)، ، فراخوانی (۰.۹۲۴) و امتیاز (۰.۹۱۳) را بهبود دهد و همگرایی پایداری در طول نسل­ های مختلف ارائه کند. ترکیب XGBoost و الگوریتم ژنتیک (GA) امکان شناسایی دقیق تر ناهنجاری­ ها را فراهم کرده و نشان می­ دهد که این رویکرد می ­تواند به عنوان یک چارچوب عملی در بهبود کنترل کیفیت، کاهش ضایعات و افزایش بهره وری خطوط تولید مورد استفاده قرار گیرد.

نویسندگان

رسول نعمت نیا

دانشجوی دکتری گروه مدیریت صنعتی، واحد تهران شمال، دانشگاه آزاد اسلامی، تهران، ایران.

مریم خادمی

دانشیار گروه ریاضی کاربردی، واحد تهران جنوب، دانشگاه آزاد اسلامی، تهران، ایران.

کیامرث فتحی

استادیار گروه مدیریت صنعتی، واحد تهران جنوب، دانشگاه آزاد اسلامی، تهران، ایران.

سهیلا سردار

استادیار گروه مدیریت صنعتی، واحد تهران شمال، دانشگاه آزاد اسلامی، تهران، ایران.

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Antonini, M., Pincheira, M., Vecchio, M., & Antonelli, F. (۲۰۲۳). ...
  • Kamran, K., & Behnamian, J. (۲۰۲۳). Unrelated parallel machine scheduling ...
  • Liu, J. (۲۰۲۴). Predicting Chinese stock market using XGBoost multi-objective ...
  • Loh, C.-H., Chen, Y.-C., & Su, C.-T. (۲۰۲۴). Using transfer ...
  • Moslemipour, G., & Ghadirpour, S. M. (۲۰۲۱). Intelligent design of ...
  • Nguyen, H. D., Tran, K. P., Thomassey, S., & Hamad, ...
  • Sadeghi, H., Farughi, H., Kalevandi, F., & Solgi, M. (۲۰۲۳). ...
  • Yang, S., Feng, M., & Guan, D. (۲۰۲۲). Intelligent scheduling ...
  • Srinath, K. R. (۲۰۱۷). Python—the fastest growing programming language. International ...
  • Soller, S., Kranz, M., & Hoelzl, G. (۲۰۲۰). Adaptive error ...
  • نمایش کامل مراجع