تشخیص خودکار گفتار و کاربردهای آن جهت تایپ گفتاری و تسریع و تسهیل ارتباط با رایانه ها و ماشین ها

سال انتشار: 1386
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 3,483

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICEC01_037

تاریخ نمایه سازی: 22 خرداد 1387

چکیده مقاله:

یکی از مهمترین مزایای تکنولوژی را می توان بهبود سطح رفاه و آسایش و تسهیل امور انسان ها دانست. زندگی امروزه بشری با انواع مختلفی از رایانه ها و کاربردهای مختلف آنها عجین شده است و این فن آوری در امر تسریع و تسهیل کارها نقش بسیار کلیدی را ایفا کرده است. هوش مصنوعی به عنوان یکی از شاخه های مدرن از دنیای رایانه که سعی در شبیه سازی اعمال انسان ها می کند، ابزارهای جدیدی را برای رفاه بیشتر جامعه پیشنهاد می نماید که برخی ا زآنها زمانی برای انسان ها فقط یک روبا بوده است. پردازش سیگنال دیجیتال و به صورت خاص تر پردازش گفتار به عنوان یکی از زمینه های هوش مصنوعی به شبیه سازی مسائل مروبط به گفتار در انسان شامل تشخیص و درک گفتار، تولید گفتار و بهبود کیفیت گفتار می پردازد. تشخیص خودکار گفتار یا بازشناسی گفتار، سنتز گفتار یا تبدیل متن به گفتار و بهبود کیفیت گفتار از جمله مهمترین زیرشاخه های پردازش گفتار می باشند که هر کدام نقش به سزایی در بهبود کیفیت زندگی افراد مختلف جامعه داشته اند. تشخیص خودکار گفتار که به فرایند تبدیل گفتار انسان به متن یا فرمان معادل گفته می شود، به رایانه ها یا ماشین ها این توانایی را می دهد که گفتار انسان را بشنوند و در مقابل آن واکنش مناسب نشان دهند. این مسأله منجر به برقراری ارتباط سریع و آسان انسان با ماشین های اطراف خود می شود و آنها را قادر می سازد تا بی‌نیاز از دکمه ها و کلیدها بتوانند با انواع رایانه ها یا ابزارهای کاربردی روزمره خود به سادگی ارتباط برقرار نمایند. سنتز گفتار یا تبدیل متن به گفتار نیز به روش های یاتلاق می شود که رایانه را قادر به خواندن متون تایپ شده می نمایند. سنتز گفتار سیستم های مختلفی از جمله اطلاع رسانی تلفنی و مرورگرهای صوتی را قادر می سازند تا متنون و اطلاعات جدیدی را که به آنها داده می شود، بی‌نیاز از انسان بیان نمایند. به علاوه روش های سنتز باعث شده اند که دنیای نابینایان به طور کلی متحول شود. سیستم های مبتنی بر این تکنولوژی نابینایان را قادر می سازد تا مطالب و متون دلخواه خود را به صورت شنیداری دریافت نمایند. آگاهی از دنیای خارج، دسترسی به منابع مختلف اطلاعاتی مانند کتاب ها و سایت های اینترنتی، تسهیل و تسریع آموزش از جمله مزایای استفاده از این سیستم ها خواهد بود. روش های بهبود کیفیت گفتار نیز به عنوان ابزاری جهت افزایش کیفیت سیگنال های صوتی و حذف نویزهای مختلف از آن و یا تقویت سیستم شنوایی افراد کم شنوا، می تواند در کاربردهای مختلفی مورد استفاده قرار گیرند. حذف نویز در کابین خلبان در هلی کوپترها، افزایش کیفیت صداهای نوارهای کاست قدیمی و حذف سرو صدای محیط در سمعک ها نمونه‌هایی از کاربرد های امروزی این تکنیک ها هستند.

نویسندگان

هادی ویسی

دانشجوی دکتری، دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شریف، شرکت عصر

حسین صامتی

هیئت علمی، دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شریف

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • ویسی هادی، روش‌های مبتنی بر مدل برای سیستم‌های با زشناسی‌گفتارمقا ...
  • ثامتی حسین، موثق حامد، باباعلی باقر، بحرانی محمد، حسین‌زاده خسرو، ...
  • باباعلی باقر، بررسی روش‌های هرس‌کردن برای بهبود عملکرد یک سیستم ...
  • شیخ‌زادگان جواد و بی‌جن‌خان محمود، دادگانهای گفتاری زبان فارسی، دومین ...
  • بی جن خان _ پیکره متنی زبان فارسی، مجموعه سخنرانی‌های ...
  • حسین زاده خسرو، بهبود دقت بازشناسی گفتار پیوسته در محیط‌های ...
  • فاضل امین، بازشناسی اعداد پیوسته از طریق خط تلفن، پایان‌نامه ...
  • حسین‌زاده خسرو، ثامتی حسین و شکیبایی علیرضا، نویسا جیبی، سیستم ...
  • الماس‌گنج فرشاد، نرم افزار بازشناسی گفتار پیوسته فارسی شنوا 2، ...
  • شمس‌فرد مهرنوش، پردازش متون فارسی: دستاوردهای گذشته، چالشهای پیش رو، ...
  • بحرانی محمد، به کارگیری ساختارهای وابسته به بافت در بازشناسی ...
  • غلامپور ایمان، بازشناسی مستقل از گوینده واجهای فارسی در صحبت ...
  • بابایی‌زاده سعید، بهبود کارایی سیستمهای بازشناسی گفتار گسسته با بهینه ...
  • ویسی پور سامان، ایجاد توانایی تشخیص کلمات خارج از واژگان ...
  • یزدچی محمدرضا، توسعه شبکه های عصبی برای تلفیق بهینه دانش ...
  • همایون‌پور محمدمهدی، سیستم بازشناسی گفتار پیوسته به کمک هیبرید شبکه ...
  • سید صالحی علی، بازشناخت گفتار پیوسته فارسی با استفاده از ...
  • شیخ زادگان جواد، تعیین هویت گوینده به صورت مستقل از ...
  • قاسمی شرف عباس، پردازش گفتار به روش انحراف زمانی پویا ...
  • L. Rabiner, B.H. Juang, Fundamentals of Speech Recognition, Prentice Hall, ...
  • J.R. Deller, J.G. Proakis & J.H.L. Hansen, Discrete-Time Processing of ...
  • _ Tert-To-Speech Syntes، _ 1996. ...
  • Allen, J, *Overview of Text- to-Speech Systems ", in Advances ...
  • B.-H. Juang and L. R. Rabiner, 40utomatic speech recognition - ...
  • Lawrence Rabiner, "Challenges in Speech in Speech Recognrition and Natural ...
  • Furui S., *50 Years of Progress in Speech and Speaker ...
  • E.A. Wan, A.T. Nelson, Handbook of Neural Networks for Speech ...
  • LIPPMANN, R. P., 'Speech recognition by machines and humans. Speech ...
  • B. Babaali, H. Sameti, *:The Sharif Speaker Independent Large Vocabulary ...
  • http ://www. speech. cs.cmu.edu ...
  • http ://www. speechatsri. com ...
  • http ://groups. _ ail.mit.edu/sls [15. http ://www.bbn. com ...
  • X.D. Huang, A. Acero, and H. Hon, Spoken language processing, ...
  • L. Rabiner, B.H. Juang, Fundamentals of Speech Recognition, Prentice Hall, ...
  • نمایش کامل مراجع