بهینه سازی پایگاه داده واژگان برای ساخت یک سیستم گفتار متن فارسی

  • سال انتشار: 1389
  • محل انتشار: هفدهمین کنفرانس مهندسی پزشکی ایران
  • کد COI اختصاصی: ICBME17_005
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1534
دانلود فایل این مقاله

نویسندگان

ایمان راسخ

دانشگاه آزاد اسلامی واحد اراک

رضا جاویدان

دانشگاه آزاد اسلامی واحد بیضافارس

چکیده

سیستم گفتار متن یکی از زمینه های به روز در مهندسی پزشکی است که می تواند بعنوان ابزاری جهت کمک به افراد ناتوانبخصوص افراد نابینا در خواندن متون از طریق شنیدن بجای دیدن بکار رود. روشهای گوناگونی در زمینه ترکیب گفتار در جهان توسعه یافته است. ترکیب ا تصالی گفتار (concatenative speech synthesis) یکی از روشهای متداول در این زمینه است. با این حال یکی از مهمترین مشکلات در ترکیب اتصالی متن فارسی، حجم بالا و ناکارآمد بودن سیستم پایگاه داده ها جهت ذخیره واژکها و اجزای تشکیلدهنده کلمات می باشد. در این مقاله به منظور بهینه سازی پایگاه داده واژگان از نظر حجم و کارایی، از یک واحد صوتی به نام دو صداییبه عنوان واحد بنیادی ذخیره سازی داده ها استفاده گردیده ودر نهایت طریقه طراحی و آموزش پایگاه داده ها مورد برسی قرار گرفتهاست. نتیجه روی داده های شبیه سازی شده بیانگر موثر بودن روش ارائه شده در این مقاله می باشد.

کلیدواژه ها

سنتز اتصالی گفتار ، پایگاه داده واژگان ، واژک ، نرمالسازی ، دوصدایی ، سه صدایی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.