بهیود بازشناسی زیرحروف فارسی با تشخیص زیرحروف شاخص و ادغام زیرحروف مشابه
- سال انتشار: 1400
- محل انتشار: چهارمین همایش بین المللی مهندسی فناوری اطلاعات، کامپیوتر و مخابرات ایران
- کد COI اختصاصی: ICTBC04_007
- زبان مقاله: فارسی
- تعداد مشاهده: 442
نویسندگان
عضو هیات علمی دانشگاه صنعتی خاتم الانبیاء بهبهان
چکیده
یکی از رویکردهای بازشناسی کلمات فارسی رویکرد مبتنی بر جداسازی است. در این رویکرد سعی می شود بدنهزیرکلمه به حروف تشکیل دهنده آن بخش بندی شود. مهمترین چالش این رویکرد تشخیص نقطه انفصال است. در اینپژوهش به جای تشخیص نقطه انفصال، بخش های اتصال دهنده زیرحروف از بدنه زیرکلمات حذف شده و زیرحروف استخراجشده اند. در مرحله تشخیص زیرحروف به وسیله شبکه عصبی، برای کاهش تعداد کلاس ها برخی از حروف شاخص که تشخیصآنها از روی ویژگی های شکلی با خطای نزدیک به صفر انجام می شود از مجموعه زیرحروف جدا شده است. همچنینزیرحروفی که از لحاظ شکل ظاهری شبیه هستند با هم ادغام شده و به عنوان یک کلاس تشخیص در نظر گرفته شده اند.در نهایت زیرحروفی که با هم ادغام شده اند به وسیله یک شبکه عصبی جدا آموزش داده شده و از یکدیگر تفکیک می شوند.نتایج نشان می دهد که این روش بهبود زیادی در تشخیص زیرحروف ایجاد می کند.کلیدواژه ها
شبکه عصبی، زیرحروف شاخص، بازشناسی اسناد چاپی فارسیمقالات مرتبط جدید
- بررسی محاسبه مقادیر اندیس انفجار و آتش سوزی(F & EI) برای روش راهنمای Dow با درنظر گرفتن قابلیت اعتماد برای اندازه های کنترل هدررفت
- بررسی آزمایشات آتش سوزی بر روی تیر های فولاد – بتن مرکب پیش تنیده با تاندون های خارجی
- بررسی تاثیر غلظت ATH بر خواص مکانیکی کامپوزیت پلی پروپیلن/آلومینیوم تری هیدرات (PP/ATH) در زمان آتش سوزی
- یک روش جدید امنیت سایبری جهت اندازه گیری عملکرد در فعالیت مشترک
- پیشرفت های نوین فناوری نانو در صنایع غذایی: از نانوحسگرها تا بسته بندی فعال
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.