طبقه بندی متون با استفاده از الگوریتم های یادگیری ماشین و مدلBERT

سال انتشار: 1401
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 257

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICCSE02_039

تاریخ نمایه سازی: 14 اسفند 1401

چکیده مقاله:

طبقه بندی خودکار متون از موارد کاربرد الگوریتم های یادگیری ماشین در بازیابی اطلاعات می باشدکه در حوزه های مختلف پردازش زبان طبیعی از جمله تحلیل های پرکاربرد است . یکی از مشکلات رایج امروزدر علوم کتابخانه ای و علوم کامپیوتری طبقه بندی اسناد است . در طول چندین سال گذشته اسناد متنی دیجیتال به صورت تصاعدی رشد یافته است یکی از نتایج این رشد تصاعدی اهمیت پیدا کردن دسته بندی اسناد بر اساس محتوا می باشد. در این تحقیق عملکرد مدلBERT و یادگیری عمیق در مقایسه با سایر الگوریتم های یادگیری ماشین بر روی دو مجموعه داده BBC news summery و Consumer Complaint Database مورد بررسی قرار گرفته است . نتایج آزمایش ها انجام شده حاکی از آن است که عملکرد الگوریتم های یادگیری عمیق در مجموعه ای با داده های کلان دقت بهتر و زمان آموزش بیشتری داشتند ولی با ارزیابی معیار دقت در مجموعه داده کوچک ، الگوریتم های سنتی یادگیری ماشین عملکرد بهتری داشتند.

نویسندگان

مازیار فنایی پور

دانشجوی کارشناسی ارشد، دانشکده مهندسی کامپیوتر، واحد نجف آباد، دانشگاه آزاد اسلامی، نجف آباد، ایران؛

حمید رستگاری

استادیار، دانشکده مهندسی کامپیوتر، واحد نجف آباد، دانشگاه آزاد اسلامی، نجف آباد، ایران؛