بازیابی اطلاعات مبتنی بر پردازش زبان طبیعی با یادگیری عمیق

سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 380

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

COMCONF08_130

تاریخ نمایه سازی: 5 بهمن 1400

چکیده مقاله:

یک سامانه بازیابی اطلاعات، اجزاو و مولفه های مختلفی دارد که از جمله مولفه های اصلی آن بخش پردازش زبان طبیعی یا NLP است به گونه ای که بتواند بفهمد منظور اصلی یک کاربر چیست و کلمات بی ربط و بی ارزش را از عبارت جستجو شده توسط کاربر، حذف کند. یکی دیگر از اجزای این سامانه ها، تطبیق جواب ها با کاربر است به گونه ای که با داشتن اطلاعات کاربر و اینکه در دفعات قبل روی کدام نتایج کلیک کرده است. نتایج دقیق تری را به او ارائه کنند که مباحثی از این دست جزو هوش مصنوعی و یادگیری ماشین در حوزه متن کاوی است. هدف از این مطالعه، ارائه یک سیستم بازیابی اطلاعات جهت کمک به کاربران برای یافتن اطلاعات مورد نظر در انبوهی از اطلاعات ساختار نایافته با دقت و حساسیت و سرعت بالا و کاهش نرخ خطای می باشد. با استفاده از یادگیری عمیق قصد داریم نظرات کاربران شبکه اجتماعی توئیتر در مورد ویروس کرونا را از نظر احساسی تحلیل کنیم و به دو د سته نظرات منفی و مثبت تقسیم بندی کنیم. این توئیت ها می توانند از چند کلمه تا سه الی چهار سطر متغیر باشند. مطالعات این پژوهش بر روی ۵۰۰۰۰ هزار توئیت کاربران شبکه اجتماعی توئیتر در مورد ویروس کرونا می باشد. سپس متون را دسته بندی می کنیم و توئیت ها را تحلیل می کنیم ، این یک مساله دو کلا سی هست یعنی می خواهیم در نهایت مساله را به کلاس مثبت یا منفی دسته بندی کنیم. . در مدل پیشنهادی این پژوهش ۷۰ درصد از دیتاست برای آموزش و ۱۵ درصد برای صحت سنجی و ۱۵ درصد برای آزمایش انتخاب می شوند. روش پیشنهادی با معیارهای ارزیابی، نرخ دقت با ۹۸.۲۵ درصد و نرخ حساسیت با ۹۷.۸۲ درصد و نرخ صحت ۹۷.۴۷ درصد، و نرخ خطای ۱.۷۵ درصد بسیار موفق عمل کرده است. سیستم بازیابی اطلاعات ایجاد شده در تحلیل احساسات با تکنیک پردازش متن با الگوریتم های شبکه عصبی برگشتی عمیق عملکرد موفقی در استخراج احساسات پشت بدنه متن با تحلیل کلمات حاوی آن داشته است. و با توجه به معیارهای ارزیابی توانسته با نرخ دقت و صحت و حساسیت بالا و نرخ خطای کم عملکرد مطلوبی داشته باشد.

کلیدواژه ها:

نویسندگان

سمیرا اسدزاده

گروه مهندسی کامپیوتر، واحد مرودشت، دانشگاه آزاد اسلامی، مرودشت، ایران

نرگس کشتکار

گروه مهندسی کامپیوتر، دانشگاه فنی و حرفه ای، بوشهر، ایران