Finding the Potential Accepted Answer on Stack Overflow: a Text Mining Approach

سال انتشار: 1400
نوع سند: مقاله ژورنالی
زبان: انگلیسی
مشاهده: 61

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_TMCH-4-4_006

تاریخ نمایه سازی: 23 تیر 1404

چکیده مقاله:

Stack Overflow serves as a widely-used, community-driven platform where developers seek assistance with programming-related issues. While the platform allows users to post questions and receive multiple answers, a significant portion of these questions do not culminate in an accepted solution. This lack of a clearly identified best answer often results in confusion for both the original poster and future visitors, as well as increased time spent navigating through numerous responses. To address this challenge, we present a method for automatically identifying the most promising answer among unaccepted ones. Our approach involves the application of text mining techniques to extract ۱۳ informative features from a large dataset comprising ۱۵,۴۶۴ questions, ۳۷,۲۷۵ answers, and ۷۲,۰۲۵ comments. These features capture various textual, structural, and user-related aspects of the posts. The extracted data are then used to train machine learning models aimed at predicting the answer most likely to be accepted. The study focuses solely on English-language content available on Stack Overflow. The proposed method demonstrates promising performance, achieving an overall accuracy of ۷۱% and an F۱ score of ۷۰%. These results suggest that automated answer recommendation can significantly enhance the user experience by reducing ambiguity and improving the efficiency of information retrieval on Q&A platforms.

نویسندگان

M.

Faculty of Informatics, Università della Svizzera Italiana, Lugano, Switzerland

P.

Department of Computer Engineering, Salman Farsi University of Kazerun, Taleghani, Kazerun, ۷۳۱۷۵-۴۵۷, Fars, Iran

S.

Department of Computer Engineering, Salman Farsi University of Kazerun, Taleghani, Kazerun, ۷۳۱۷۵-۴۵۷, Fars, Iran

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Faisal, M. S., et al. (۲۰۱۹). Expert ranking techniques for ...
  • Mamykina, L., et al. (۲۰۱۱). Design lessons from the fastest ...
  • Fellbaum, C. (۱۹۹۸). WordNet: An electronic lexical database. MIT Press. ...
  • نمایش کامل مراجع