دسته بندی اسناد فارسی با استفاده از شبکه های عصبی

زهرا نوریان; میثم یدالله زاده طبری

دسته بندی اسناد فارسی با استفاده از شبکه های عصبی

محل انتشار: سومین کنفرانس بین المللی دستاوردهای نوین در علوم مهندسی و پایه

سال انتشار: 1394

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,237

فایل این مقاله در 10 صفحه با فرمت PDF و WORD قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/455688

شناسه ملی سند علمی:

AEBSCONF03_007

تاریخ نمایه سازی: 19 اردیبهشت 1395

چکیده مقاله:

در این مقاله کار دسته بندی اسناد فارسی مشتقاز پیکره استاندارد روزنامه همشهری طی سالهای مختلف انجام گرفته به منظور اجرا استفاده از شبکه های عصبی با الگوریتم پس انتشار و شبکه های باور عمیق مبتنی بر یادگیری عمیق تحت زبان برنامه نویسی پایتون استفاده شده.اسناد پیکره همشهری به صورت فایل های مشخص XML استفاده شده اند.تگ های ID, DOC, TXT برای انجام کار پیش پردازش داده ها برای دسته بندی استخراج شدند.کار پیش پردازش داده ها شامل مراحل نشان گذاری،حذف علائم،حذف ایست واژه ها و ریشه یابی کلمات با استفاده از کتابخانه هضم انجام گرفته.پس از پیش پردازش با استفاده از بردار وزنی TF-IDFماتریس وزنی کلمات تشکیل شده و بعداز آن با استفاده از روش کاهش ابعادی SVD این ماتریس از زائدات کاهش یافته است.ماتریس کاهش یافته به عنوان ورودی برای شبکه های عصبی با الگوریتم پس انتشار استفاده شده و جهت دسته بندی با شبکه های باور عمیق کار پیش پردازش داده ها و سایر مراحل با استفاده از کتابخانه های زبان پایتون که به این منظور در مبحث یادگیری عمیق طراحی شده اند انجام گرفته است.عمل یادگیری در شبکه های عصبی و شبکه باور عمیق در 100 رده انجام پذیرفته و معیارهای قابل بررسی در این مسئله دقت، فراخوانی، اندازه گیریF-و کارایی می باشند.پس از اجرای کار دسته بندی بر روی این دو دسته بند نتایج به دست آمده نشان داده است که دقت ، سرعت و کارایی در شبکه های باور عمیق به مراتب مطلوب تر از شبکه های عصبی با الگوریتم پس انتشار است.

کلیدواژه ها:

دسته بندی ، متن کاوی ، پیکره همشهری ، شبکه عصبی ، یادگیری عمیق ، فراوانی وزنی

نویسندگان

زهرا نوریان

نویسنده مسوول: دانشجوی فوق لیسانس دانشگاه آزاد اسلامی واحددامغان

میثم یدالله زاده طبری

مربی فوق لیسانس دانشگاه آزاد بابل ، دکتری هوش مصنوعی دانشگاه شاهرود

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

اشورای عالی اطلاع رسانی دانشگاه علم وصنعت، تحلیل سیستم یافتن ...
استخراج نقشه دانش هوشمندی کسب و کار با رویکرد متن کاوی [مقاله کنفرانسی]
حسن پور ح.مدنی .ص (1393) "مجله علمی پژوهشی رایانش نرم ...
Fault Tolerance In Grid Computing The Median Resource Failure Checkpointing With Last Failure Checkpoint [مقاله کنفرانسی]
_ .همایونپور. م (1393)"استفاده از انرژی آزاد در روش واگرایی ...
امامی م .(1376) "بررسی مسایل درک متن فارسی _ پیاده ...
صراف زاده ع. (1389) سمینار علمی، آمفی تئاتر دانشکده مهندسی، ...
A.Khan, B. Baharudin, and K. Khan, "Efficient Feature Selection and ...
Anvari, H.: Sokhan Dictionary (2 Vol.). Sokhan Publishers, Tehran (2004) ...
C. Saedi, M. Shamsfard, and Y. Motazedi, "Automatic Translation between ...
Keyvan, F. (ed.): Developing PersiaNet: The Persian Wordnet. In: Proceedings ...
Famina, A., Aghajaney, D.: Towards Building a WordNet for Persian ...
Haghshenas, A.M., Samei, H., Entekahbi, N.: Farhang Moaser Engli sh-Persian ...
M. Farhoodi and A. Yari, "Applying machine learning algorithms for ...
M. Shamsfard, A. Hesabi, H. Fadaei, N. Mansoory, A. Famian, ...
M. Zanjani and A. Baraani Dastjerdi, "New Method for Electronic ...
Sadeghi, A. A.: On denominative verbs in Persian. (article in ...

نمایش کامل مراجع