بررسی و تست مجموعه پرسش و پاسخ های بخش پایتون سایت استک آورفلوو با استفاده از الگوریتم های فضای برداری، تخصیص پنهان دیریکله و ارتباط معنی نهفته

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 576

فایل این مقاله در 27 صفحه با فرمت PDF و WORD قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ITCOMI01_055

تاریخ نمایه سازی: 24 شهریور 1397

چکیده مقاله:

یکی از شاخه های متن کاوی سیستم پرسش و پاسخ می باشد. در این سیستم با استفاده از روش های مختلف پرسش ها تحلیل و پاسخ آن ها استخراج می شود. سایت استک آور فلوو نیز یک سایت از نوع پرسش و پاسخ های تخصصی است و نیاز به یک سیستم پرسش و پاسخ برای چنین سایت هایی احساس می شود. در این مقاله دیتا ست های سایت مذکور را با سه الگوریتم بازیابی اطلاعات تست و نتایج مورد بررسی قرار گرفته. تست الگوریتم ها بر روی 500 زوج پرسش و پاسخ که به صورت تصادفی انتخاب شده اند انجام گرفته. زوج ها براساس نمونه گیری تصادفی از میان هزاران سوال و جواب جدا شده است. طبق نتایج الگوریتم فضای برداری همراه با پیش پردازش هایی نظیر ریشه یابی، حذف کلمات و حروف اضافه، یافتن نقش کلمه (POS tag) و... بهترین نتیجه را در جستجو و یافتن پاسخ پرسش ها به دنبال داشت. الگوریتم ها به زبان برنامه نویسی پایتون بوده و نتایج نهایی حاصل از اجرا در یک فایل متنی ذخیره می شد. بعد از تست داده ها با استفاده از دیگر الگوریتم ها نتایج به دست آمده را با یکدیگر بررسی کرده. نتیجه هر الگوریتم در شرایط مختلف مورد بررسی قرار گرفت و در پایان الگوریتم فضای برداری بهترین نتیجه را در بر داشت.

نویسندگان

مصطفی سعیدی کیا

شناسی ارشد، مهندسی نرم افزار موسسه آموزش عالی زند شیراز، شیراز

علیرضا ملاح زاده

استادیار، تخصص برق، موسسه آموزش عالی زند شیراز،

امیر حسین راسخ

استادیار، تخصص مهندسی کامپیوتر نرم افزار، موسسه آموزش عالی زند شیراز