استفاده از تکنیک های یادگیری ماشین برای پیش بینی دقیق اشکالات نرم افزاری

میثم عسکریان; محمد علی فرطوسی

استفاده از تکنیک های یادگیری ماشین برای پیش بینی دقیق اشکالات نرم افزاری

فایل این در 8 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل

من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این :

https://civilica.com/doc/2455093

چکیده :

پیش بینی باگ های نرم افزاری یکی از موضوعات کلیدی در مهندسی نرم افزار است که می تواند نقش مهمی در کاهش هزینه توسعه، افزایش کیفیت محصول و جلوگیری از خطاهای بحرانی ایفا کند. این پژوهش با هدف ارائه یک رویکرد ترکیبی و مدرن، از مدل های یادگیری ماشین کلاسیک (SVM، Random Forest، XGBoost) در کنار مدل های گراف محور (GNN و Hierarchical Attention Graphs) و مدل های زبانی پیشرفته (CodeBERT و LLMهای جدید) برای پیش بینی باگ در پروژه های بزرگ استفاده می کند. داده ها از مخازن GitHub و Apache شامل 12٬500 نمونه برچسب گذاری شده استخراج شده و شامل 23 ویژگی کدی، ساختاری و رفتاری توسعه دهنده هستند. نتایج نشان می دهد مدل های ترکیبی شامل CodeBERT+GNN و GNN با توجه سلسله مراتبی (HAG-SDP) عملکردی برتر نسبت به روش های کلاسیک ارائه می دهند. همچنین استفاده از مدل های LLM برای پاک سازی داده و تشخیص commitهای درهم ریخته موجب افزایش چشمگیر دقت نهایی شد. در نهایت، مدل XGBoost نیز در میان روش های کلاسیک بهترین عملکرد را ارائه داد. این پژوهش نشان می دهد که پیش بینی باگ با ترکیب یادگیری ماشینی، یادگیری عمیق گرافی و مدل های زبانی می تواند راهکاری قدرتمند و آینده دار در پروژه های نرم افزاری بزرگ باشد.

کلیدواژه ها:

یادگیری ماشین ، پیش بینی باگ ، مهندسی نرم افزار ، گراف نرونال شبکه ها ، داده کاوی.

نویسندگان

میثم عسکریان

دانشجوی کاردانی رشته نرم افزار دانشگاه ملی مهارت

محمد علی فرطوسی

معاون شرکتهای دولتی و دستگاه های ملی (مرکز ملی مولد سازی)سازمان خصوصی سازی

مراجع و منابع این :

لیست زیر مراجع و منابع استفاده شده در این را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود لینک شده اند :

1. Chen, T., et al. "XGBoost: A Scalable Tree Boosting System." ...
2. Opu et al. “LLM-Based Detection of Tangled Code Changes.” arXiv, ...
3. DeMuVGN: “Effective Software Defect Prediction via Multi-View Graph Networks.” arXiv, ...
4. HAG-SDP: “Hierarchical Attention-Based Graph Neural Network for Software Defect Prediction.” ...
5. Wang et al. “Deep Graph Neural Networks for Software Defect ...
6. “Leveraging Large Language Models for Just-In-Time Bug Prediction.” ACM, 2024. ...
7. Devlin, J. “CodeBERT for Semantic Code Understanding.” ACM, 2023. ...
8. Google Engineering. “ML-Based Bug Classification in Android.” 2022. ...
9. Hassan, A. “Mining Software Repositories – Updated Edition.” Springer, 2023. ...

نمایش کامل مراجع