شناسایی رویکرد بهینه همترازسازی در آزمون‌های چندبعدی

سمیه بهمن آبادی; محمدرضا فلسفی نژاد; علی دلاور; نورعلی فرخی; اصغر مینایی

شناسایی رویکرد بهینه همترازسازی در آزمون‌های چندبعدی

محل انتشار: فصلنامه مطالعات اندازه گیری و ارزشیابی آموزشی، دوره: 10، شماره: 30

سال انتشار: 1399

نوع سند: مقاله ژورنالی

زبان: فارسی

مشاهده: 655

فایل این مقاله در 48 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/1145915

شناسه ملی سند علمی:

JR_JRESE-10-30_007

تاریخ نمایه سازی: 6 بهمن 1399

چکیده مقاله:

همترازسازی از مهم‌ترین مسائل در نظام سنجش تربیتی است و عدم برقراری مفروضات آن، اندازه‌گیری را با چالش‌های جدی مواجه می‌کند. در آزمون‌های چندبعدی، استفاده از روش‌های تک‌بعدی همترازسازی، سوگیری نتایج را به دنبال دارد. هدف از اجرای این پژوهش، شناسایی رویکرد بهینه همترازسازی در آزمون‌های چندبعدی بود. شش روش همترازسازی تک‌بعدی و چندبعدی مقایسه شدند. روش همصدک به لحاظ مقاوم بودن در برابر مفروضه تک‌بعدی بودن به‌عنوان ملاکی برای مقایسه سایر روش‌ها مدنظر قرار گرفت. جامعه آماری شامل همه داوطلبان گروه علوم ریاضی و فنی کنکور سراسری سال 96 و 97 بود. داده‎های آزمون ریاضی تعداد 5000 نفر از هر دو سال برای همترازسازی انتخاب شدند. ابعاد آزمون‌ها با استفاده از نرم‌افزارهای MPLUS وNOHARM مشخص شد. برای برآورد پارامترهای تک‌بعدی از بستهltm و برای برآورد پارامترهای چندبعدی از بسته mirt در نرم‌افزار R استفاده شد. همترازسازی نمره مشاهده شده و نمره واقعی تک‌بعدی IRT با استفاده از نرم‌افزار PIE و همترازسازی همصدک با استفاده از نرم‌افزار R بسته equate انجام گرفت. از بسته‌های mirt، mvnorm و MASS در نرم‌افزار R نیز برای همترازسازی چندبعدی داده‌ها استفاده شد. نتایج نشان داد که در همترازسازی آزمون‌های چندبعدی بهینه‌ترین روش، همترازسازی چندبعدی کامل است و پس از آن روش نمره مشاهده شده چندبعدیِ تک‌بعدی شده، روش‎ مناسبی است، اما استفاده از روش‌های تک‌بعدی نمره مشاهده شده و نمره واقعی در چنین شرایطی، کارایی مناسبی ندارد. بنابراین پیشنهاد می‌شود در همترازسازی آزمون‌هایی که ساختار چندبعدی دارند، از روش همترازسازی نمره مشاهده شده چندبعدی کامل استفاده شود.

کلیدواژه ها:

همترازسازی چندبعدی کامل ، همترازسازی نمره واقعی چندبعدیِ تک‌بعدی شده ، همترازسازی نمره مشاهده شده چندبعدی تک‌بعدی شده ، همترازسازی همصدک ، نظریه پرسش پاسخ چندبعدی

نویسندگان

سمیه بهمن آبادی

دانشجوی دکتری سنجش و اندازهگیری، دانشگاه علامه طباطبایی، تهران، ایران

محمدرضا فلسفی نژاد

دانشیار گروه سنجش واندازهگیری دانشگاه علامه طباطبایی، تهران، ایران

علی دلاور

استاد ممتاز گروه سنجش و اندازهگیری، دانشگاه علامه طباطبایی، تهران، ایران.

نورعلی فرخی

دانشیار گروه سنجش و اندازهگیری، دانشگاه علامه طباطبایی، تهران، ایران

اصغر مینایی

دانشیار گروه سنجش واندازهگیری، دانشگاه علامه طباطبایی، تهران، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

ایزانلو، بلال؛ بازرگان، عباس؛ فرزاد، ولی‌الله؛ صادقی، ناهید؛ کاوسی، امیر ...
رضوانی‌فر، شیرین (1391). همترازسازی نمرات دروس ریاضی و فیزیک رشته ...
شاطریان محمدی، فاطمه (1382). مقایسه سه روش همترازسازی همصدک هموار نشده نمره مشاهده شدهIRT و ...
لرد، فردریک، ام (1980). کاربردهای نظریه سؤال- پاسخ؛‌ ترجمه علی ...
مقدم‌زاده، علی (1392). روش بهینه همترازسازی با توجه به ویژگی ...
واشقانی فراهانی، مریم (1380). کاربرد روش همترازسازی همصدک در معادل‌سازی ...
Ackerman, T. A., Gierl, M. J., & Walker, C. M. ...
Akin Arikan, C. (2019). A Comparison of Kernel Equating Methods ...
Béguin, A. A., & Hanson, B. A. (2001). Effect of ...
Brossman, B. G. (2010). Observed score and true score equating ...
Brossman, B. G., & Lee, W. C. (2013). Observed score ...
Cao, Y. (2008). Mixed-format test equating: Effects of test dimensionality and ...
Chalmers, R. P. (2012). mirt: A multidimensional item response theory ...
Champlain, A. F. (1996). The Effect of Multidimensionality on IRT ...
Chen, J. (2014). Model selection for IRT equating of Testlet-based tests ...
Choi, J. (2019). Comparison of MIRT observed score equating methods ...
Dorans, N. J. & Holland, P. W. (2000). Population invariance ...
Fraser, C., & McDonald, R. P. (2012). NOHARM 4: A ...
Freeman, L. (2016). Assessing model-data fit for compensatory and non-compensatory ...
Genz, F., Bretz, T., Hothorn, T., Miwa, X., Mi, F., ...
González, J., & Wiberg, M. (2017). Applying test equating methods. New ...
Han, T., Kolen, M., & Pohlmann, J. (1997). A comparison ...
Hanson, B., & Zeng, L. (2004). PIE: A computer program ...
Hanson, B., & Zeng, L. (2004). PIE: A computer program ...
Hooper, D., Coughlan, J., & Mullen, M. R. (2008). Structural ...
Jasper, F. (2010). Applied dimensionality and test structure assessment with ...
Kahraman, N. (2013). Unidimensional interpretations for multidimensional test items. Journal ...
Kim, S. Y. (2018). Simple structure MIRT equating for multidimensional ...
Kim, S. Y., Lee, W. C., & Kolen, M. J. ...
Kline, R. B. (2015). Principles and practice of structural equation ...
Kolen, M. J., & Brennan, R. L. (2004). Test equating, ...
Lee, E, Lee, W.C., Brennan, R. L. (2014). Equating Multidimensional ...
Lee, E. (2013). Equating multidimensional tests under a random groups ...
Lee, S. H. (2007). Multidimensional item response theory: A SAS MDIRT ...
Li, Y. H. (1997). An evaluation of multidimensional IRT equating ...
Li, Y. H., & Lissitz, R. W. (2000). An evaluation ...
Li, Y., Jiao, H., & Lissitz, R. W. (2012). Applying ...
Lim, E. (2016). Subscore equating with the random groups design. ...
Lim, E.; Lee, W. C. (2016). Subscore Equating and Reporting. ...
Lord, F. M. (1980). Applications of item response theory to ...
Lord, F. M., & Wingersky, M. S. (1984). Comparison of ...
Meng, Y. (2012). Comparison of Kernel Equating and Item Response Theory ...
Min, K. S., & Kim, J. P. (2003). A Comparison ...
Peterson, J. L. (2014). Multidimensional item response theory observed score equating ...
R Development Core Team. (2013). R: A language and environment ...
Reckase, M. D. (2009). Multidimensional Item Response Theory: Statistics for ...
Ricker, K. L. (2007). The Consequence of Multidimensionality IRT Equating ...
Rizopoulos, D. (2006). ltm: An R package for latent variable ...
Sansivieri, V., Wiberg, M., & Matteucci, M. (2017). A review ...
Seo, D. G., & Weiss, D. J. (2015). Best design ...
Simon, M. K. (2008). Comparison of concurrent and separate multidimensional IRT ...
Spence, P. D. (1996). The effect of multidimensionality on unidimensional ...
Suksuwan, S., Junpeng, P., Ngudgratoke, S., & Guayjarernpanishk, P. (2012). ...
Svetina, D., & Levy, R. (2012). An overview of software ...
Venables, W. N. and Ripley, B. D. (2019). Modern Applied ...
Von Davier, A. (Ed.). (2010). Statistical models for test equating, scaling, ...
Von Davier, A. A., Holland, P. W., & Thayer, D. ...
Wang, S., Zhang, M., & You, S. (2020). A Comparison ...
Wetzel, E., & Hell, B. (2014). Multidimensional Item Response Theory ...
Wiberg, M. (2018). equateIRT Package in R. Measurement: Interdisciplinary Research ...
Zhang, O. (2012). Observed score and true score equating for multidimensional ...

نمایش کامل مراجع