استفاده از تکنیک های یادگیری ماشین برای پیش بینی دقیق اشکالات نرم افزاری
فایل این در 8 صفحه با فرمت PDF قابل دریافت می باشد
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
چکیده :
پیش بینی باگ های نرم افزاری یکی از موضوعات کلیدی در مهندسی نرم افزار است که می تواند نقش مهمی در کاهش هزینه توسعه، افزایش کیفیت محصول و جلوگیری از خطاهای بحرانی ایفا کند. این پژوهش با هدف ارائه یک رویکرد ترکیبی و مدرن، از مدل های یادگیری ماشین کلاسیک (SVM، Random Forest، XGBoost) در کنار مدل های گراف محور (GNN و Hierarchical Attention Graphs) و مدل های زبانی پیشرفته (CodeBERT و LLMهای جدید) برای پیش بینی باگ در پروژه های بزرگ استفاده می کند. داده ها از مخازن GitHub و Apache شامل 12٬500 نمونه برچسب گذاری شده استخراج شده و شامل 23 ویژگی کدی، ساختاری و رفتاری توسعه دهنده هستند. نتایج نشان می دهد مدل های ترکیبی شامل CodeBERT+GNN و GNN با توجه سلسله مراتبی (HAG-SDP) عملکردی برتر نسبت به روش های کلاسیک ارائه می دهند. همچنین استفاده از مدل های LLM برای پاک سازی داده و تشخیص commitهای درهم ریخته موجب افزایش چشمگیر دقت نهایی شد. در نهایت، مدل XGBoost نیز در میان روش های کلاسیک بهترین عملکرد را ارائه داد. این پژوهش نشان می دهد که پیش بینی باگ با ترکیب یادگیری ماشینی، یادگیری عمیق گرافی و مدل های زبانی می تواند راهکاری قدرتمند و آینده دار در پروژه های نرم افزاری بزرگ باشد.
کلیدواژه ها:
نویسندگان
میثم عسکریان
دانشجوی کاردانی رشته نرم افزار دانشگاه ملی مهارت
محمد علی فرطوسی
معاون شرکتهای دولتی و دستگاه های ملی (مرکز ملی مولد سازی)سازمان خصوصی سازی
مراجع و منابع این :
لیست زیر مراجع و منابع استفاده شده در این را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود لینک شده اند :