CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

یک روش ترکیبی برای جست وجوی کلمات درکتب تاریخی دست نویس فارسی

عنوان مقاله: یک روش ترکیبی برای جست وجوی کلمات درکتب تاریخی دست نویس فارسی
شناسه ملی مقاله: IPRIA01_092
منتشر شده در اولین کنفرانس بازشناسی الگو و پردازش تصویر ایران در سال 1391
مشخصات نویسندگان مقاله:

محمد علی آبادی - دانشگاه بیرجند، دانشکده مهندسی برق و کامپیوتر، دانشجوی کارشناسی ارشد الکترونیک
جواد صدری - دانشگاه بیرجند، دانشکده مهندسی برق و کامپیوتر، استادیار گروه کامپیوتر
سیدمحمد رضوی - دانشگاه بیرجند، دانشکده مهندسی برق و کامپیوتر، استادیار گروه الکترونیک

خلاصه مقاله:
جست وجوی کلمات کلیدی در کتب و متون تاریخی دست نویس برای محققان و پژوهشگران علوم مختلف از اهمیت بالایی برخوردار است. از آنجاکه این کتب با گذشت زمان دچار فرسودگی شده اند، لذا تصاویر اسکن شده آنها نیزکیفیت بالایی ندارند و بنابراین روشهای مبتنی بر بازشناسی حروفOCR)برروی این متون خوب کار نمی کنند و دقت عملکرد بسیار پایینی دارند. در این مقاله ، ما یک فرایند کامل برای مکان یابی کلمات در تصاویر اسکن شده ی کتب تاریخیدست نویس فارسی وعربی ارائه می دهیم. دراین فرایند، ابتدا زیرکلمات موجود در صفحات کتاب استخراج شده و اطلاعات مکانی این زیرکلمات ذخیره می شود. درادامه دونوع ویژگی شامل پروفایلها و ناحیه بندی از تصاویر زیرکلمات استخراج می شود. در مرحله ی بعد، با استفاده از یک روش خوشه بندی جدید که در [ 1] مطرحشده است و با در نظر گرفتن معیار شباهت بین این ویژگی ها بصورت ترکیبی از معیارهای انحراف زمانی پویا و فاصله اقلیدسی ، زیرکلمات در خوشه های هم ارز طبقه بندی می شوند. درنهایت هم، خوشه ها برچسب گذاری می شوند. حال اگرکاربر، کلمه ای را درون کتاب مورد جستجو قرار دهد، با داشتن اطلاعات مربوط به تمام زیرکلمات موجود در خوشه ها، مکانهای احتمالی وقوع آن کلمه در کتاب با دقت نسبتا بالایی به کاربر ارائه می گردد. این الگوریتم را برروی یک کتاب تاریخی دست نویس فارسی موجود در کتابخانه ی مرکزی دانشگاه بیرجند مورد آزمایش قراردادیم که دقت بالا و قابل قبولی را نتیجه داد

کلمات کلیدی:
مکان یابی کلمات، متون تاریخی دست نویس فارسی، انحراف زمانی پویاDTW) ، پروفایلها، ناحیه بندیZoning) ، خوشه بندی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/275984/