طراحی و پیاده سازی الگوریتم تطابق اسامی در زبان فارسی به منظور ذینفع واحد

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 605

فایل این مقاله در 16 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CEBPS03_027

تاریخ نمایه سازی: 5 آبان 1397

چکیده مقاله:

الگوریتم تطابق اسامی با یکدیگر، مورد استفاده تمام کسانی قرار خواهد گرفت که به نحوی، ناگزیر به انجام مقایسه، بین اسامی و تطابق آنها با هم، در کاردبرهایشان هستند. در صنعت بانکداری، به ویژه در بانکداری الکترونیک، به هنگام مواجه شدن با فرایندهای بین شعبه ای و بین بانکی، آنجا که ما ناچار به نگاه کلی به داده های پراکنده موجود در بانک های مختلف هستیم و مشکل تشخیص یکی بودن اشخاص حقیقی و حقوقی بروز پیدا می کند، این الگوریتم به صورت پر رنگ کاربردی می شود. همین طور در زمینه بانکداری و مالی برای تشخیص تقلب، مدیریت ارتباط با مشتری، ضد پولشویی، رتبه بندی اعتباری، ذینفع واحد و بسیاری موارد دیگر نقش کلیدی و بنیادین دارد. به دلیل نقش مهم و حیاتی این مسیله در موارد ذکر شده و زمینه های دیگر، تا کنون در علم کامپیوتر، الگوریتم های بسیاری در این زمینه ارایه شده است.این الگوریتم ها خطاهای مربوط به املای اسامی، مخفف اسامی، کنیه، اسامی باطل شده، و زیاد و کم شدن بخش هایی در اسامی را مدیریت می کند و اسامی متعلق به یک هویت را علی رغم بروز تغییرات در موارد ذکر شده تشخیص می دهد. اما بیشتر الگوریتم های موجود، خاص زبان انگلیسی هستند و ویژگی ها و خصوصیات این زبان را پوشش می دهند و تاکنون این کار برای زبان فارسی انجام نشده است. هدف این مقاله، ارایه الگوریتمی می باشد که برای زبان فارسی طراحی و پیاده سازی شده است. پس از انجام بررسی های لازم بر روی الگوریتم های موجود، یکی از الگوریتم های پایه ای در زمینه مقایسه و تطابق اسامی انتخاب شده و برای زبان فارسی تغییر و بهینه سازی شده است. در نهایت الگوریتم طراحی شده، اسامی زبان فارسی را به عنوان ورودی گرفته و در خروجی درصد شباهت آنها به یکدیگر را مشخص می کند. این الگوریتم برای تعیین و برآورد شباهت بین دو اسم، شباهت آنها را از سه منظر صوتی، نوشتاری و نمایش حروف به کار رفته و نزدیکی حروف آنها بر روی کیبورد، بررسی و لحاظ می کند و بعد از انجام عملیات محاسباتی، در نهایت احتمال یکی بودن اسامی را به درصد بیان می کند. کارایی این الگوریتم در راستای این که بتواند برای حجم بالای داده بانکی به صورت موثر کار کند، از اهمیت بالایی برخوردار بوده است.