دسته بندی خودکار متون فارسی با استفاده از شبکه های عصبی
محل انتشار: اولین کنفرانس ملی محاسبات نرم و فن آوری اطلاعات
سال انتشار: 1389
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 3,668
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NCSCIT01_014
تاریخ نمایه سازی: 19 بهمن 1390
چکیده مقاله:
گسترش اینترنت باعث افزایش نمایی حجم اسناد الکترونیکی نه تنها به زبان انگیلسی بلکه به زبان سایر کشورها شده است.دسته بندی متون بر اساس روش های مختلفی مانند مدل فضای برداری (VSM) , شبکه عصبی مصنوعی (ANN) , kهمسایه نزدیک (KNN) در میان محققین بازیابی اطلاعات و متون عمومیت یافته سات.در این مقاله کاربرد دو روش مدل فضای برداری و شبکه عصبی مصنوعی برای سدته بندی متون فارسی با استفاده از اسناد پیکره همشهری بررسی شده است.در روش های ارائه شده , با استفاده از تخصیص وزن , اهمیت کلمات در اسناد مشخص می شود. روش مدل فضا برداری نیازمند فضای برداری با ابعاد زیاد است در حالی که روش ارائه شده نیازمند تعداد ویژگی های کمتری است. نتایج آزمایشات نشان می دهد که استفاده از شبکه های عصبی برای دسته بندی اسناد فارسی در مقایسه با مدل فضا برداری از کارایی مناسب نری برخوردار است.
کلیدواژه ها:
نویسندگان
محمد حسین بیات
گروه کامپیوتر - دانشگاه آزاد اسلامی واحد تفرش
سید محمد حسینی خوزانی
گروه کامپیوتر - دانشگاه آزاد اسلامی واحد تفرش
محبوبه گاپله
گروه کامپیوتر - دانشگاه آزاد اسلامی واحد تفرش