یادگیری عمیق در شناسایی موجودیت های نامدار در متون فارسی
سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 689
فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ITCT11_027
تاریخ نمایه سازی: 18 اردیبهشت 1400
چکیده مقاله:
با توجه به وجود حجم عظیم اطلاعات غیر ساختار یافته، پردازش زبان طبیعی اهمیت ویژه ای دارد. دانش پردازش زبان طبیعی، دانشی است که بین هوش مصنوعی و زبان شناسی قرار گرفته. شناسایی موجودیت های نام دار یکی از زیرشاخه های پردازش زبان طبیعی است و نقش مهمی در انواع برنامه های پردازش زبان طبیعی مانند بازیابی اطلاعات، خلاصه سازی خودکار متن، پاسخ به پرسش، ترجمه ماشین، شناسایی نقل قول و غیره دارد. شناسایی موجودیت های نامدار به تششخیص و دسته بندی واحدهای معنادار مانند اسامی اشخاص، مکان ها، سازمان ها، زمان، تاریخ، واحد پول و درصد در متن می پردازد. در سال های اخیر پژوه های بسیاری در زمینه استفاده از شبکه های عصبی و یادگیری عمیق درشناسایی موجودیت های نامدار انجام گرفته است. در این پژوه ما با استفاده از ترکیب شبکه LSTM دو طرفه و شبکه عصبی کانولوشن، معمار ی را ارائه می دهیم که از هر دو نوع بازنمایی در سطح کلمه و نویسه به صورت خودکار بهره مند می شود. از دو پیکره برچسب خورده فارسی پیما و آرمان برای آموزش و ارزیابی مدل استفاده کرده ایم و بهترین ساختار به ترتیب ۸۹.۴% و ۹.۸۴% در سطح کلمه و عبارت برای معیار f۱ بدست آورده است.
کلیدواژه ها:
نویسندگان
سحر کیلانی کاظمی
دانشجوی کارشناسی ارشد، گروه کامپیوتر، دانشکده فنی و مهندسی، دانشگاه الزهرا، تهران، ایران
رضا عزمی
دانشیار، گروه کامپیوتر، دانشکده فنی و مهندسی، دانشگاه الزهرا، تهران، ایران