دسته بندی سوالات Stack Overflow با استفاده از بازنمایی های سنتی و جدید

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 239

متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

DCBDP06_026

تاریخ نمایه سازی: 25 اسفند 1399

چکیده مقاله:

برچسب گذاری خودکار سوالات زبان های برنامه نویسی نقش مهمی در مرتبط کردن سوالات با پاسخ دهندگان در یک پلتفرم پرسش و پاسخ دارد. دسته بندی سوالات با استفاده از متن سوال و با بكارگيری روش های یادگيری ماشين یكی از روش های مورد استفاده در این زمينه است. با توجه به اینكه در دسته بندی سوالات بازنمایی متن نقش ویژه ای در عملكرد دسته بند دارد، در این مقاله بازنماییسنتی مبتنی بر مدل n-grams به همراه فرکانس کلمه -معكوس فرکانس سند با بازنمایی جدید مبتنی بر روش های یادگيری عميق مورد مقایسه قرار گرفت. پس از انجام پيش پردازش و ساخت بردارهای ورودی، دسته بندهای بيز ساده، رگراسيون لجستيک، ماشين بردار پشتيبان و K نزدیكترین همسایه روی مجموعه ای از سوالات سایت Stack Overflow اعمال گردید. همچنين یک تكنيکمبتنی بر حافظه طولانی کوتا ه-مدت پياده سازی گردید. نتایج روی داده های مورد استفاده در این مقاله نشان می دهد که مدل های مبتنی بر بازنمایی سنتی دقت بهتری نسبت به بازنمایی مبتنی بر یادگيری عميق دارند.

کلیدواژه ها:

دسته بندی سوالات ، یادگیری ماشین ، بازنمایی مبتنی بر مدل n-grams ، بازنمایی مبتنی بر یادگیری عمیق

نویسندگان

حسین پاکروح

دانشکده فناوری اطلاعات و مهندسی کامپیوتر، دانشگاه شهید مدنی آذربایجان، تبریز

حسین عباسی مهر

دانشکده فناوری اطلاعات و مهندسی کامپیوتر، دانشگاه شهید مدنی آذربایجان، تبریز