بهینه سازی پایگاه داده واژگان برای ساخت یک سیستم گفتار متن فارسی
- سال انتشار: 1389
- محل انتشار: هفدهمین کنفرانس مهندسی پزشکی ایران
- کد COI اختصاصی: ICBME17_005
- زبان مقاله: فارسی
- تعداد مشاهده: 1534
نویسندگان
دانشگاه آزاد اسلامی واحد اراک
دانشگاه آزاد اسلامی واحد بیضافارس
چکیده
سیستم گفتار متن یکی از زمینه های به روز در مهندسی پزشکی است که می تواند بعنوان ابزاری جهت کمک به افراد ناتوانبخصوص افراد نابینا در خواندن متون از طریق شنیدن بجای دیدن بکار رود. روشهای گوناگونی در زمینه ترکیب گفتار در جهان توسعه یافته است. ترکیب ا تصالی گفتار (concatenative speech synthesis) یکی از روشهای متداول در این زمینه است. با این حال یکی از مهمترین مشکلات در ترکیب اتصالی متن فارسی، حجم بالا و ناکارآمد بودن سیستم پایگاه داده ها جهت ذخیره واژکها و اجزای تشکیلدهنده کلمات می باشد. در این مقاله به منظور بهینه سازی پایگاه داده واژگان از نظر حجم و کارایی، از یک واحد صوتی به نام دو صداییبه عنوان واحد بنیادی ذخیره سازی داده ها استفاده گردیده ودر نهایت طریقه طراحی و آموزش پایگاه داده ها مورد برسی قرار گرفتهاست. نتیجه روی داده های شبیه سازی شده بیانگر موثر بودن روش ارائه شده در این مقاله می باشد.کلیدواژه ها
سنتز اتصالی گفتار ، پایگاه داده واژگان ، واژک ، نرمالسازی ، دوصدایی ، سه صداییمقالات مرتبط جدید
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.