مدل سازی خطی و تحلیل رگرسیون: مروری کوتاه بر مزایا و معایب مدل سازی خطی و شرایط استفاده از مدل رگرسیون

سال انتشار: 1403
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 135

فایل این مقاله در 15 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_CBB-3-2_007

تاریخ نمایه سازی: 11 دی 1403

چکیده مقاله:

مقدمه: امروزه بسته های نرم افزاری قدرتمند و کاربردی، تحلیل داده ها را ساده کرده و در نتیجه کاربرد علم داده را در تمام زمینه های تحقیقاتی توسعه داده است. بر این اساس، رگرسیون تقریبا در تمام جنبه های علوم زیستی، از سلامت انسان گرفته تا کشاورزی و علوم دامی اعمال شده است. اما در دهه های گذشته اشتباهات شایان توجهی در استفاده از این مدل گزارش شده است. هدف از این مقاله بررسی مدل سازی با این روش مهم آماری و آشنا کردن خوانندگان جهت کاربرد درست این روش و مفروضات و شرایط استفاده از آن است.مواد و روش ها: در این مقاله مروری از داده های واقعی استفاده گردیده است و نحوه انجام تحلیل های انجام شده در نرم افزارهای آماری SAS و R و کدهای مربوط به آنها در قسمت پیوست آورده شده است.یافته ها: در مفروضات مورد نیاز مدل رگرسیونی، باقیمانده های مدل باید به طور نرمال توزیع شده باشند، اما انجام آزمون نرمال بودن برای مقادیر واقعی متغیر پاسخ یا هر یک از متغیرهای مستقل اجباری نیست. از سوی دیگر، تقریبا تمام روش های تست توزیع نرمال، مانند Kolmogorov-Smirnov، برای تعداد زیاد داده، طراحی شده اند. این نشان می دهد که استفاده از چنین روش هایی برای آزمون نرمال بودن باقیمانده های مدل تخمین زده شده بر اساس تعداد داده پایین، عمدتا کمتر از صد مورد، چندان دقیق نخواهد بود. موضوع دیگر مربوط به هم خطی بین متغیرهای مستقل است. باید به این نکته توجه کرد که یافتن ضریب همبستگی برابر با صفر (R = ۰) حتی بین هر جفت متغیر تصادفی جداگانه بسیار دشوار است. بنابراین در تمامی مدل های رگرسیونی به نوعی همبستگی بین متغیرهای مستقل وجود خواهد داشت، اما موضوع مهم این است که فقط همبستگی زیاد باعث ایجاد مشکلات شدید در مدل می شود. پیشنهاد می گردد که به جای استفاده از روش ساده همبستگی از روش های تخصصی مانند ضریب تورم واریانس (VIF) یا تجزیه و تحلیل مولفه اصلی (PCA) برای تشخیص شدت هم خطی استفاده گردد. یکی دیگر از مفروضات رگرسیون مربوط به  خطی بودن مدل است که گاهی تبدیل این مشکل را برطرف کند. باید توجه شود که تبدیل داده ها منجر به تغییر واحد متغیرها یا تغییر جهت برداری آنها در یک فضای هندسی و در برخی موارد تغییر ساختار صحیح آنها می شود.نتیجه گیری: در مدل رگرسیون با افزایش تعداد داده، درجه آزادی خطا ​​به سرعت افزایش می یابد و میانگین مجذور خطای نهایی به میزان قابل توجهی کاهش می یابد. مقدار کم میانگین مربعات خطا منجر به یک مدل بسیار معنی دار می شود. در مقابل، پراکندگی نقاط داده در اطراف خط رگرسیون ممکن است بسیار گسترده باشد. به همین دلیل، استفاده از ضریب تبیین که معمولا معیار مناسبی برای تست برازش مدل است. هرچه پراکندگی نقاط مربوط به داده ها در اطراف خط رگرسیون گسترده تر باشد، مقدار ضریب تعیین کمتر است. مقادیر بالای این ضریب نشان دهنده مدل مناسب برای مجموعه داده های مورد استفاده است. یک مقدار مناسب برای ضریب تبیین را نمی توان بین دامنه ای از مقادیر برای همه آزمایش ها توصیه کرد.

نویسندگان

آرمین ساعدموچشی

بخش تحقیقات علوم زراعی و باغی، مرکز تحقیقات و آموزش کشاورزی و منابع طبیعی کرمانشاه، مرکز تحقیقات، آموزش و ترویج کشاورزی، کرمانشاه، ایران.

سودابه ساعدی

بخش گیاه پزشکی، دانشکده کشاورزی، دانشگاه رازی، کرمانشاه، ایران.

فاطمه انصارشوریجه

گروه مهندسی منابع طبیعی، دانشکده کشاورزی، دانشگاه شیراز، شیراز، ایران.

عباس زضایی زاد

بخش تحقیقات علوم زراعی و باغی، مرکز تحقیقات و آموزش کشاورزی و منابع طبیعی کرمانشاه، مرکز تحقیقات، آموزش و ترویج کشاورزی، کرمانشاه، ایران.

امین صادقی

گروه گیاه پزشکی، دانشکده کشاورزی، دانشگاه کردستان، سنندج، ایران.

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Aliakbari, M., A. Saed-Moucheshi, H. Hasheminasab, H. Pirasteh-Anosheh, M. T. ...
  • Bagya Lakshmi, H., M. Gallo and R. M. Srinivasan. ۲۰۱۸. ...
  • Baum, C. F. and A. Lewbel. ۲۰۱۹. Advice on using ...
  • Bazilevsky, M. P. ۲۰۱۸. Research of new criteria for detecting ...
  • James, G., D. Witten, T. Hastie, R. Tibshirani, G. James, ...
  • Kabaila, P., D. Farchione, S. Alhelli and N. Bragg. ۲۰۲۱. ...
  • Lio, W. and B. Liu. ۲۰۱۸. Residual and confidence interval ...
  • Morrissey, M. B. and G. D. Ruxton. ۲۰۱۸. Multiple regression ...
  • Saed-Moucheshi, A., E. Fasihfar, H. Hasheminasab, A. Rahmani and A. ...
  • Saed-Moucheshi, A., M. Pessarakli and B. Heidari. ۲۰۱۳b. Comparing relationships ...
  • Saed-Moucheshi, A., H. Razi, A. Dadkhodaie, M. Ghodsi and M. ...
  • Souza, L. C., R. M. C. R. Souza, G. J. ...
  • Vosough, A., R. Ghouchani and A. Saed-Moucheshi. ۲۰۱۵. Genotypic Variation ...
  • نمایش کامل مراجع