لب خوانی با استفاده از شبکه های عصبی محرک وتاثیر آن در خواندن کلمات با مشاهده تصویر

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 555

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICCONF05_158

تاریخ نمایه سازی: 27 مرداد 1399

چکیده مقاله:

هدف این مقاله توسعه یک سیستم بازشناسی گفتار مبتنی بر ویدئو است، که برای افراد مبتلا به اختلال شنوایی استفاده میشود تا بیماران مبتلا به سرطان حنجره، افراد مبتلا به فلج تارهای صوتی در محیط پر سر و صدا را درک کنند. و همچنین قادر به یادگیری و شناسایی کلمات از مجموعه داده های استفاده شده باشند. برای این کار ابتدا ، به جمع آوری اطلاعات خودکار از برنامه های تلویزیونی پرداخته شده است. که شامل یک مجموعه داده می باشد؛ سپس یک شبکه عصبی معرفی شده است که قادر به یادگیری و شناسایی تعدادی کلمه از این مجموعه داده بزرگ هستند.

کلیدواژه ها:

نویسندگان

علیرضا فرداد

دانشجوی دکتری رشته مهندسی فناوری اطلاعات،دانشکده فنی و مهندسی دانشگاه آزاد اسلامی واحد سبزوار ،ایران

آراز جهانشاهی

دانشجوی دکتری رشته مهندسی فناوری اطلاعات،دانشکده فنی و مهندسی دانشگاه آزاد اسلامی واحد سبزوار،ایران