بررسی تاثیر ترکیب امتیازات حاصل از بردارهای ویژگی متفاوت گفتار در فضای i-Vector برای سیستم تایید هویت گوینده مستقل از متن

سال انتشار: 1395
محل انتشار: بیست و دومین کنفرانس ملی سالانه انجمن کامپیوترایران
کد COI اختصاصی: ACCSI22_031
زبان مقاله: فارسی
تعداد مشاهده: 616

نویسندگان

دانشجوی دکتری برق/مخابرات سیستم، پژوهشکده برق جهاد دانشگاهی، تهران

دانشیار پژوهش، پژوهشکده برق جهاد دانشگاهی، تهران

چکیده

استفاده از گفتار برای تشخیص هویت افراد با وجود مزایای زیادی چون کاربرپسند بودن و پیچیدگی پیاده سازی کم، محدودیت هایی نیز دارد که از آن جمله می توان به کاهش دقت این روش در محیط های واقعی به دلیل حضور نویزهای مختلف اشاره کرد. تا کنون روش های گوناگونی برای حل این مشکل در مراحل مختلف سیستم تایید هویت گوینده یعنی استخراج ویژگی، مدل سازی و مقایسه و امتیازدهی ارایه شده است که البته هیچکدام مصون از خطا نیستند. ترکیب روش های مختلف در مراحل گوناگون یک راه حل مرسوم برای بهبود کارایی سیستم های تشخیص هویت است. در این مقاله تاثیر ترکیب ویژگی های مختلف در مرحله امتیازات بر کارایی سیستم تایید هویت گوینده، برای چهار بردار ویژگی MFCC، LFCC، IMFCC و PNCC، در شرایط گفتار تمیز و نویزی مورد ارزیابی و مقایسه قرار گرفته است. مدل سازی گوینده در فضای بردارهای هویت و بر مبنای الگوریتم i-Vector/PLDA انجام گرفته و در پیاده سازی آزمون ها برای سیگنال گفتار و نویز به ترتیب از دادگان های TIMIT و NOISEX-92 استفاده گردیده است. نتایج آزمون ها نشان می دهد ترکیب امتیازات حاصل از بردارهای متفاوت انرژی خطای سیستم تایید هویت گوینده را کاهش می دهد و این کاهش در برخی حالات بسیار چشمگیر است.

کلیدواژه ها

بردارهای ویژگی گفتار، تایید هویت، ترکیب، گفتار نویزی، بردار هویت، i-Vector

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.