استخراج و پیاده سازی مدل آماری برای اتصال واجهای فارسی

سال انتشار: 1380
محل انتشار: چهارمین کنفرانس دانشجویی مهندسی برق ایران
کد COI اختصاصی: ISCEE04_037
زبان مقاله: فارسی
تعداد مشاهده: 1346

دانلود فایل این مقاله

نویسندگان

محمد محمودی قیداری

دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف

امین کرباسی

آزمایشگاه پردازش اطلاعات دانشکده مهندسی برق دانشگاه صنعتی امیرکبیر

فربد رزازی

آزمایشگاه پردازش اطلاعات دانشکده مهندسی برق دانشگاه صنعتی امیرکبیر

چکیده

دراین مقاله مدلی آماری برای دنباله های فونتیکی گفتار فارسی ارائه شده است با توجه به اینکه در زبان فارسی به مدلسازی زبانی کمتر پرداخته شدهاست اینم وضوع می تواند به کاهش احتمال خطای سیستم های بارشناسی کمک شایانی کند مبنای این مدلسازی مدل n-gram با روش هموارسازی درون یابی بوده است سیستم پیاده سازی شده برای مدلهای 1-gram,2-gram,3-gram,4-gram آزموده شده است و بهترین نتیجه برای 4-gram با هموارسازی درون یابی به ازای ضریب ثابت 0/9 بدست آمده است که کمترین پیچیدگی 3.73 به دست آمده است.

کلیدواژه ها

بازشناسی گفتار، NLP، مدلسازی زبانی، مدل n-gram، هموارسازی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.