ناشر تخصصی کنفرانس های ایران

لطفا کمی صبر نمایید
CIVILICAWe Respect the Science
ناشر تخصصی کنفرانسهای ایران
عنوان
مقاله

یک رویکرد فازی در خوشه بندی کلمات برای ساخت مدل های زبانی آماری

تعداد صفحات: 5 | تعداد نمایش خلاصه: 1826 | نظرات: 0
سال انتشار: 1385
کد COI مقاله: ACCSI12_302
زبان مقاله: فارسی
(فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد)

مشخصات نویسندگان مقاله یک رویکرد فازی در خوشه بندی کلمات برای ساخت مدل های زبانی آماری

چکیده مقاله:

استفاده از مدل زبانی به صورت n-gram مبتنی بر کلمه در سیستم های بازشناسی گفتار پیوسته بسیار رایج می باشد. به منظور استفاده از این مدل زبانی نیاز به استخراج آن از دادگان متنی غنی می باشد. دادگان های متنی موجود در زبان فارسی آنقدر غنی نیستند که بتوان با کمک آن ها مدل های آماری مبتنی بر کلمات معتبری را استخراج کرد. به همین منظور سعی بر این است که به جای به دست آوردن احتمال دنبا لهم امدن کلمات، احتمال دنبال هم آمدن خوشه هایی که آن کلمات به آن ها متعلق هستند استخراج شود. دراین پژوهش یک ایده فازی برای خوشه بندی کلمات فارسی به منظور ایجاد مدل زبانی مبتنی بر خوشه بررس شده است که دران هر کلمه با درجات عضویت متفاوت به خوشه های مختلف تعلق دارد. الگوریتم خوشه بندی C-mean فازی می باشد. بر همین مبنا پارامترهای مختلفی در این الگوریتم مورد بررسی قرار گرفته و نهایتا بر روی 20000 کلمه پر کاربرد از دادگان متنی زبان فارسی اعمال شده است. مدل زبانی حاصل از آن در سیستم بازشناسی گفتار پیوسته مستقل از گوینده فارسی مورد آزمایش قرار گرفته و در نهایت باعث بهبود در دقت بازشناسی گردیده است.

کلیدواژه ها:

بازشناسي گفتار ، خوشه بندي كلمات ، خوشه بندي فازي ، مدل زباني

کد مقاله/لینک ثابت به این مقاله

برای لینک دهی به این مقاله می توانید از لینک زیر استفاده نمایید. این لینک همیشه ثابت است و به عنوان سند ثبت مقاله در مرجع سیویلیکا مورد استفاده قرار میگیرد:

https://civilica.com/doc/44688/

کد COI مقاله: ACCSI12_302

نحوه استناد به مقاله:

در صورتی که می خواهید در اثر پژوهشی خود به این مقاله ارجاع دهید، به سادگی می توانید از عبارت زیر در بخش منابع و مراجع استفاده نمایید:
ممتازی، سعیده و ثامتی، حسین و بحرانی، محمد و حافظی، نازیلا،1385،یک رویکرد فازی در خوشه بندی کلمات برای ساخت مدل های زبانی آماری،دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران،تهران،،،https://civilica.com/doc/44688

در داخل متن نیز هر جا که به عبارت و یا دستاوردی از این مقاله اشاره شود پس از ذکر مطلب، در داخل پارانتز، مشخصات زیر نوشته می شود.
برای بار اول: (1385، ممتازی، سعیده؛ حسین ثامتی و محمد بحرانی و نازیلا حافظی)
برای بار دوم به بعد: (1385، ممتازی؛ ثامتی و بحرانی و حافظی)
برای آشنایی کامل با نحوه مرجع نویسی لطفا بخش راهنمای سیویلیکا (مرجع دهی) را ملاحظه نمایید.

مدیریت اطلاعات پژوهشی

صدور گواهی نمایه سازی | گزارش اشکال مقاله

اطلاعات استنادی این مقاله را به نرم افزارهای مدیریت اطلاعات علمی و استنادی ارسال نمایید و در تحقیقات خود از آن استفاده نمایید.

مقالات مرتبط جدید

به اشتراک گذاری این صفحه

اطلاعات بیشتر درباره COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.

پشتیبانی