رده بندی متون فارسی با استفاده از یادگیری عمیق

امید حاجی پور; سعیده سادات سدیدپور

رده بندی متون فارسی با استفاده از یادگیری عمیق

محل انتشار: چهارمین کنفرانس ملی فناوری در مهندسی برق، کامپیوتر

سال انتشار: 1397

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,317

فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/928975

شناسه ملی سند علمی:

TECCONF04_130

تاریخ نمایه سازی: 30 شهریور 1398

چکیده مقاله:

با رشد سریع و روز افزون اطلاعات، رده بندی مستندات یکی از ابزارهای کلیدی برای سازماندهی و مدیریت داده های متنی به شمار می آید که در کاربردهایی مانند تقسیم بندی اخبار، نامه های الکترونیکی و اطلاعات آنلاین مورد استفاده قرار میگیرد. در واقع رده بندی موضوعی متون، تعیین موضوع یک متن میباشد. با وجود کارهای خوب صورت گرفته در زمینه متون فارسی، هنوز برخی از چالشها به صورت حل نشده باقی مانده اند. از جمله این چالشها استخراج ویژگی از متون برای رده بندی آنها میباشد . در این مقاله روشی پیشنهاد شده است که با استفاده از شبکه های عصبی پیچشی و مکرر، ویژگیهای متن را استخراج کرده و با استفاده از شبکه های تماما0متصل ، هر متن رده بندی میشود. روش پیشنهادی در مقایسه با سایر روشهای ردهبندی برای زبان فارسی دارای نتایج بهتری میباشد. اکثر روشهای موجود در زبان فارسی دقتی حدود %90 را دارند، این در حالی است که روش پیشنهادی از دقت بالای %94 برخوردار است.

کلیدواژه ها:

رده بندی موضوعی ، متن فارسی ، متن کاوی ، داده کاوی ، یادگیری عمیق ، استخراج ویژگی ، شبکه های عمیق پیچشی ، شبکه های عمیق مکرر.

نویسندگان

امید حاجی پور

دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی مالکاشتر، تهران، ایران.

سعیده سادات سدیدپور

استادیار گروه هوشمصنوعی، دانشگاه صنعتی مالکاشتر، تهران، ایران.