طراحی و پیاده سازی سیستم تصحیح املا در زبان کردی با استفاده از روش کد گذاریsoundex
محل انتشار: یازدهمین کنفرانس سراسری سیستم های هوشمند
سال انتشار: 1391
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 900
فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICS11_056
تاریخ نمایه سازی: 14 مهر 1392
چکیده مقاله:
اگرچه برای تشخیص و تصحیح خطا تا کنون الگوریتم های زیادی پیشنهاد شده است ولی در این میان الگوریتم هایی که از روشهای کد گذاری استفاده می کنند جایگاه ویژهای دارند. روش کد گذاری Soundex یکی از شناخته شده ترین و پرکاربردترین الگوریتم های کد گذاری است که بویژه در زبان هایی که نظام آوایی خاصی دارند، همچون انگلیسی، مفید واقع شده است. با توجه به نحوه کد گذاری در این روش و همچنین ساختار ویژه زبان کردی، میتوان از این الگوریتم به شکل مناسب در سیستم تصحیح گر املای کردی استفاده کرد و درصد بالایی از خطاهای نوشتاری در این زبان را شناسایی و تصحیح نمود. اساس کد گذاری soundex بر پایه نحوه تلفظ کردن همخوان هاست. در این روش به چهار همخوان اول مطابق جدول از پیش تعریف شده ای، کد تعلق گرفته در حالی که به واکه ها هیچ کدی تعلق نمی گیرد. شناسایی و تصحیح خطا بر اساس کد تعلق گرفته به کلمه و مقایسه با کدهای موجود در پایگاه داده است. مطابق با آمارها و مطالعاتمان، 85.54 درصد از کل خطاهای موجود در متون کردی مربوط به واکه ها و چند همخوان ویژه زبان کردی می باشد؛ بدین معنا که در کلمات مختلف، واکه ها و آن چند همخوان که شیوه نگارش آنها به هم نزدیک است، به اشتباه به جای همدیگر مورد استفاده قرار می گیرند. بنابراین با استفاده از روش soundex درصد بسیار قابل توجهی از خطاها را می توان اصلاح نمود. نتایج شبیه سازی ها نشان می دهد که 94.36 درصد از کل خطاها با استفاده از این روش قابل اصلاح می باشد
کلیدواژه ها:
نویسندگان
ئاسو بزرگ پناه
دانشکده فنی مهندسی، دانشگاه کردستان
فردین اخلاقیان
دانشکده فنی مهندسی، دانشگاه کردستان
وفا بارخدا
دانشکده فناوری اطلاعات، دانشگاه صنعتی کرمانشاه
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :