بازشناسی کلمات دست نوشته با ویژگی های نوین و کاهش فرهنگ لغت
سال انتشار: 1396
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 343
فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_JMVIP-4-2_003
تاریخ نمایه سازی: 23 اردیبهشت 1400
چکیده مقاله:
بازشناسی کلمات دست نوشته و تبدیل آن به متن تایپی معادل می تواند در تفسیر دست نوشته و جستجو در اسناد بسیار حائز اهمیت باشد. در این مقاله سیستمی به منظور تشخیص برون خط دست نوشته فارسی در یک فرهنگ لغت محدود معرفی شده است. به منظور استخراج ویژگی، بعد از بلوک بندی تصویر ورودی و استخراج مرکز هر بلوک توسط مرکز ثقل، میانگین مرکز اجزای متصل از الگوریتم سیفت متراکم استفاده شده است. از روش آنالیز تفکیک کننده خطی برای کاهش تعداد ویژگی ها استفاده شده است. در این مقاله، در مرحله نخست کلمات موجود در فرهنگ لغت بر اساس شباهت با استفاده از الگوریتم ISOCLUSE به همراه الگوریتم سلسله مراتبی خوشه بندی شده است. میانگین هر خوشه در فضای ویژگی به عنوان نماینده آن خوشه و مدخل مشترک اعضای آن خوشه در فرهنگ لغت تصویری، در نظر گرفته شده است. در مرحله دوم به منظور بازشناسی کلمه ی جدید از کلمات کاندید، از روش ماشین بردار پشتیبان به صورت چندکلاسه و دو کلاسه استفاده شده است. نتایج بدست آمده نشان دهنده عملکرد بهتر روش ماشین بردار پشتیبان دو کلاسه از لحاظ سرعت و دقت بر روی مجموعه داده ایران شهر می باشد. در مرحله بازشناسی با انتخاب ۵ خوشه نزدیک به کلمه دست نوشته مورد آزمون با دقت ۹۳.۳۷% حدود ۷۶.۶۵% از کلمات مورد بررسی کاهش خواهد یافت.
کلیدواژه ها:
تشخیص کلمه دست نوشته ، آنالیز تفکیک کننده خطی ، سیفت متراکم ، کاهش فرهنگ لغت ، الگوریتم خوشه بندی ISOCLUSE ، کلاس بند ماشین بردار پشتیبان دوکلاسه
نویسندگان
سمیه برومند
دانشجوی کارشناسی ارشد مهندسی کامپیوتر، گرایش علوم تصمیم و مهندسی دانش، دانشگاه آزاد اسلامی واحد مبارکه
مجید ایرانپور مبارکه
دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه پیام نور