نرمال سازی متون فارسی با استفاده از تطابق با الگوی عبارات
- سال انتشار: 1383
- محل انتشار: دهمین کنفرانس سالانه انجمن کامپیوتر ایران
- کد COI اختصاصی: ACCSI10_083
- زبان مقاله: فارسی
- تعداد مشاهده: 2690
نویسندگان
آزمایشگاه سیستمهای هوشمند صوتی گفتاری دانشگاه صنعتی امیرکبیر
چکیده
نرمالسازی یکی از مسائل مهمدر پردازش متن و تبدیل متن به گفتار است دراین مقاله به بررسی عمل نرمال سازی متون فارسی وهمچنین مسائل مطرح در آن می پردازیم در آغاز به بررسی جوانب مختلف کار درعمل نرمال سازی متون فارسی می پردازیم و سپس راه هایی را برای آن پیشنهادمی کنیم این راه حلها علیرغم ساده بودن نیازهای موجوددر نرمال سازی را برطرف می کند اما عیوبی نیز دارند که هدفما دراین مقاله نیز بررسی عیوب اینگونه روشها است روش پیشنهادی پیاده سازی و برروی مجموعه ای از متون فارسی در زمینه های مختلف ارزیابی گردیده است. نتایج بررسی ها نشان میدهد که برای رفع نواقص روش پیشنهادی نیاز به یک موتور پردازش زبان طبیعی نیز وجود دارد.کلیدواژه ها
مقالات مرتبط جدید
- tGraph_PheroWalk : یک الگوریتم جدید برای یادگیری بازنمایی گراف های پویا
- Efficient Triple Modular Redundancy for Reliability Enhancement of DNNs Using Explainable AI
- مقایسه فناوری CMUT با پیزوالکتریک برای کاربرد در تصویربرداری التراسونیک
- بهبود کنترل دست رباتیک به کمک کنترل کننده تطبیقی فازی-PID
- طراحی و شبیه سازی آنتن تک قطبی چند بانده فشرده با تغذیه ریز نوار برای بهبود عملکرد در باندهای فرکانسی ۲.۵، ۳.۸، ۵.۴ و ۶.۹ گیگاهرتز
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.