Persian speech sentence segmentation without speech recognition

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: انگلیسی
مشاهده: 991

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICS12_228

تاریخ نمایه سازی: 11 مرداد 1393

چکیده مقاله:

In this paper, we propose a method for detection of Persian speech sentence boundaries using a set of prosodic features and spectral centroid. No speech recognizer is used inour proposed method. Silent regions are first detected using four features including spectral centroid, zero crossing rate, energyand pitch. Then, twelve prosodic features are extracted from each silent region. Silent regions may correspond to a sentenceboundary or other regions inside a sentence. Features of Silenceregions of speech data from some speakers are extracted and labeled as silence in the boundary or inside the sentences. Thesefeature vectors and a nonlinear support vector machine (SVM) classifier, is trained and then evaluated for detection of Persianspeech sentence boundaries. The proposed algorithm was evaluated on six speakers from Large FARSDAT data set. Aperformance of 82.4% F-measure was achieved on test set from all speakers in training data and 73.02% F-measure on speakers outside the training data.

نویسندگان

Hoda Sadat Jafari

Laboratory for Intelligent Multimedia Processing (LIMP)Computer Engineering and Information Technology Department, Amirkabir University of Technology Tehran, Iran

Mohammad Mehdi Homayounpour

Laboratory for Intelligent Multimedia Processing (LIMP)Computer Engineering and Information Technology Department, Amirkabir University of Technology Tehran, Iran

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Ann lee, James R. Glass, Sentence Detection Using Multiple Annotations, ...
  • E. Shriberg, A. Stolcke, "Prosody-Based Automatic Segmentation of Speech into ...
  • نمایش کامل مراجع