رده بندی متون فارسی با استفاده از یادگیری عمیق

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 878

فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

TECCONF04_130

تاریخ نمایه سازی: 30 شهریور 1398

چکیده مقاله:

با رشد سریع و روز افزون اطلاعات، رده بندی مستندات یکی از ابزارهای کلیدی برای سازماندهی و مدیریت داده های متنی به شمار می آید که در کاربردهایی مانند تقسیم بندی اخبار، نامه های الکترونیکی و اطلاعات آنلاین مورد استفاده قرار میگیرد. در واقع رده بندی موضوعی متون، تعیین موضوع یک متن میباشد. با وجود کارهای خوب صورت گرفته در زمینه متون فارسی، هنوز برخی از چالشها به صورت حل نشده باقی مانده اند. از جمله این چالشها استخراج ویژگی از متون برای رده بندی آنها میباشد . در این مقاله روشی پیشنهاد شده است که با استفاده از شبکه های عصبی پیچشی و مکرر، ویژگیهای متن را استخراج کرده و با استفاده از شبکه های تماما0متصل ، هر متن رده بندی میشود. روش پیشنهادی در مقایسه با سایر روشهای ردهبندی برای زبان فارسی دارای نتایج بهتری میباشد. اکثر روشهای موجود در زبان فارسی دقتی حدود %90 را دارند، این در حالی است که روش پیشنهادی از دقت بالای %94 برخوردار است.

کلیدواژه ها:

رده بندی موضوعی ، متن فارسی ، متن کاوی ، داده کاوی ، یادگیری عمیق ، استخراج ویژگی ، شبکه های عمیق پیچشی ، شبکه های عمیق مکرر.

نویسندگان

امید حاجی پور

دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی مالکاشتر، تهران، ایران.

سعیده سادات سدیدپور

استادیار گروه هوشمصنوعی، دانشگاه صنعتی مالکاشتر، تهران، ایران.