تشخیص هوشمند و خودکار غلط های تایپی در پایگاه داده های بزرگ بدون استفاده از لغت نامه

سال انتشار: 1396
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 530

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_TJEE-47-1_015

تاریخ نمایه سازی: 10 تیر 1396

چکیده مقاله:

غلط های تایپی یکی از مشکلات مهم در سیستم های کامپیوتری و سیستم های پایگاه داده ای است. وجود غلط های تایپی در پایگاه داده ها نهتنها از نظر صحت پایگاه داده مشکل ساز هستند، بلکه باعث می شوند به هنگام ضرورت نتوان رکورد واردشده را بازیابی کرد. همین امر گاه باعثمی شود که کاربر مجددا همان رکورد را وارد پایگاه داده نماید که باعث به وجود آمدن افزونگی می گردد. روش های موجود تشخیص غلط ها، مبتنیبر لغت نامه هستند. بدین معنی که از یک لغت نامه بزرگ که همه لغات آن صحیح فرض می شوند استفاده می کنند و اگر کلمه ای در لغت نامه نباشدبه عنوان غلط تایپی شناخته می شود. تهیه لغت نامه ای بزرگ و با دقت بالا بسیار پرهزینه و زمان بر است. به علاوه چنین لغت نامه ای مختص یکزمینه خاص (مثلا محیط پزشکی) است و قابل استفاده و در زمینه های دیگر (مثلا جامعه شناسی) نیست. در این مقاله روشی ارایه می شود که بدوننیاز به لغت نامه می تواند غلط های تایپی را تشخیص دهد. روش پیشنهادی با چند معیار مرسوم ارزیابی شده است. نتایج آزمایش ها نشان دهندهدقت 93/5 درصدی برای این روش است. علاوه بر دقت بالای روش پیشنهادی، عدم نیاز به لغت نامه یک ویژگی منحصر به فرد برای آن به شمارمی رود.

کلیدواژه ها:

تشخیص غلط های تایپی ، غلط های املایی ، فازی

نویسندگان

الناز زعفرانی معطر

مربی، گروه مهندسی کامپیوتر، واحد تبریز، دانشگاه آزاد اسلامی، تبریز، ایران

محمدرضا فیضی درخشی

استادیار، گروه مهندسی کامپیوتر، دانشکده مهندسی برق و کامپیوتر، دانشگاه تبریز، تبریز، ایران

آزاده روحانی

مربی، گروه مهندسی کامپیوتر، واحد خسروشاه، دانشگاه آزاد اسلامی، خسروشاه، ایران