CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

شناسایی لهجه های زبان فارسی مبتنی بر مدل بردار هویت

عنوان مقاله: شناسایی لهجه های زبان فارسی مبتنی بر مدل بردار هویت
شناسه ملی مقاله: CECCONF08_037
منتشر شده در هشتمین کنفرانس ملی علوم و مهندسی کامپیوتر و فناوری اطلاعات در سال 1398
مشخصات نویسندگان مقاله:

رسول مهدوی - دانشگاه صداو سیمای جمهوری اسلامی ایران
اعظم باستان فرد - دانشگاه صداو سیمای جمهوری اسلامی ایران

خلاصه مقاله:
سیستم شناسایی لهجه یکی از زمینه های پرکاربرد در پردازش گفتار است که لهجه یک گوینده را از روی صحبتش تشخیص میدهد. در این پژوهش دقت شناسایی برای 5 لهجه بومی زبان فارسی (ترکی ، تهرانی ، کردی، اصفهانی ،شمالی) با استفاده از ویژگیهای MFCC و MFCC+SDC و مدل سازهای قدرتمندی همچون GMM_UBM و بردار هویت و به دنبال آن توسط معیار معروف شباهت کسینوسی مورد ارزیابی قرار گرفت. نتایج نشان می دهد که استفاده از ویژگی MFCC+SDC و مدلساز بردار هویت می تواند دقت میانگین سیستم شناسایی لهجه را تا 66.08 درصد بالاببرد در حالیکه دقت میانگین برای مدل ساز 49.11 GMM_UBM درصد میباشد.

کلمات کلیدی:
شناسایی لهجه بومی ، مدل GMM_UBM ، مدل بردار هویت

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/984816/