برچسب زنی اجزای سخن در زبان فارسی با استفاده از شبکه عصبی کانولوشن

  • سال انتشار: 1399
  • محل انتشار: هفتمین کنگره ملی تازه یافته های مهندسی برق ایران
  • کد COI اختصاصی: COMCONF07_250
  • زبان مقاله: فارسی
  • تعداد مشاهده: 631
دانلود فایل این مقاله

نویسندگان

عرفان رحمانی

گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی ارومیه، ارومیه، ایران

سیامک سرمدی

استادیار گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی ارومیه، ارومیه، ایران

چکیده

مشخص نمودن نقش دستوری کلمات یک جمله (برای مثال اسم، فعل و مفعول) برچسب زنی اجزای سخن نامیده می شود. ابزارهای برچسب زنی معمولا درکاربردهای مختلف پردازش زبان از جمله ترجمه ماشینی، تجزیه دستوری و اصلاح غلط های نوشتاری مورد استفاده قرار میگیرند. تحقیقات زیادی در زمینه برچسب زنی اجزای سخن در زبانهای مختلف انجام شده است ولی با توجه به متفاوت بودن قوانین دستوری و مورفولوژیکی زبان فارسی محققین این زبان، با چالش های خاصی مواجه می باشند. روش های برچسبزنی موجود از مدل های مختلف زبانی و آماری بهره برده اند. این مقاله برای دستیابی به دقت مناسب در برچسبزنی اجزای سخن، از شبکه عصبی کانولوشن CNN استفاده می نماید. مدل پیشنهادی معرفی شده، در ارزیابی انجام شده، به دقت 98/55 درصد دست یافته است.

کلیدواژه ها

برچسب زنی اجزای سخن، تعبیه کلمات، پردازش زبان طبیعی، مجموعه نوشته

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.