رده بندی متون فارسی با استفاده از یادگیری عمیق
سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 878
فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
TECCONF04_130
تاریخ نمایه سازی: 30 شهریور 1398
چکیده مقاله:
با رشد سریع و روز افزون اطلاعات، رده بندی مستندات یکی از ابزارهای کلیدی برای سازماندهی و مدیریت داده های متنی به شمار می آید که در کاربردهایی مانند تقسیم بندی اخبار، نامه های الکترونیکی و اطلاعات آنلاین مورد استفاده قرار میگیرد. در واقع رده بندی موضوعی متون، تعیین موضوع یک متن میباشد. با وجود کارهای خوب صورت گرفته در زمینه متون فارسی، هنوز برخی از چالشها به صورت حل نشده باقی مانده اند. از جمله این چالشها استخراج ویژگی از متون برای رده بندی آنها میباشد . در این مقاله روشی پیشنهاد شده است که با استفاده از شبکه های عصبی پیچشی و مکرر، ویژگیهای متن را استخراج کرده و با استفاده از شبکه های تماما0متصل ، هر متن رده بندی میشود. روش پیشنهادی در مقایسه با سایر روشهای ردهبندی برای زبان فارسی دارای نتایج بهتری میباشد. اکثر روشهای موجود در زبان فارسی دقتی حدود %90 را دارند، این در حالی است که روش پیشنهادی از دقت بالای %94 برخوردار است.
کلیدواژه ها:
رده بندی موضوعی ، متن فارسی ، متن کاوی ، داده کاوی ، یادگیری عمیق ، استخراج ویژگی ، شبکه های عمیق پیچشی ، شبکه های عمیق مکرر.
نویسندگان
امید حاجی پور
دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی مالکاشتر، تهران، ایران.
سعیده سادات سدیدپور
استادیار گروه هوشمصنوعی، دانشگاه صنعتی مالکاشتر، تهران، ایران.