طراحی و پیاده سازی الگوریتم تطابق اسامی در زبان فارسی به منظور ذینفع واحد

  • سال انتشار: 1392
  • محل انتشار: سومین همایش ملی بانکداری الکترونیک و نظام های پرداخت
  • کد COI اختصاصی: CEBPS03_027
  • زبان مقاله: فارسی
  • تعداد مشاهده: 785
دانلود فایل این مقاله

نویسندگان

لیلا مومنی نسبه

نیما امیرشکاری

جلال ملکی

لارس اهرنبرگ

چکیده

الگوریتم تطابق اسامی با یکدیگر، مورد استفاده تمام کسانی قرار خواهد گرفت که به نحوی، ناگزیر به انجام مقایسه، بین اسامی و تطابق آنها با هم، در کاردبرهایشان هستند. در صنعت بانکداری، به ویژه در بانکداری الکترونیک، به هنگام مواجه شدن با فرایندهای بین شعبه ای و بین بانکی، آنجا که ما ناچار به نگاه کلی به داده های پراکنده موجود در بانک های مختلف هستیم و مشکل تشخیص یکی بودن اشخاص حقیقی و حقوقی بروز پیدا می کند، این الگوریتم به صورت پر رنگ کاربردی می شود. همین طور در زمینه بانکداری و مالی برای تشخیص تقلب، مدیریت ارتباط با مشتری، ضد پولشویی، رتبه بندی اعتباری، ذینفع واحد و بسیاری موارد دیگر نقش کلیدی و بنیادین دارد. به دلیل نقش مهم و حیاتی این مسیله در موارد ذکر شده و زمینه های دیگر، تا کنون در علم کامپیوتر، الگوریتم های بسیاری در این زمینه ارایه شده است.این الگوریتم ها خطاهای مربوط به املای اسامی، مخفف اسامی، کنیه، اسامی باطل شده، و زیاد و کم شدن بخش هایی در اسامی را مدیریت می کند و اسامی متعلق به یک هویت را علی رغم بروز تغییرات در موارد ذکر شده تشخیص می دهد. اما بیشتر الگوریتم های موجود، خاص زبان انگلیسی هستند و ویژگی ها و خصوصیات این زبان را پوشش می دهند و تاکنون این کار برای زبان فارسی انجام نشده است. هدف این مقاله، ارایه الگوریتمی می باشد که برای زبان فارسی طراحی و پیاده سازی شده است. پس از انجام بررسی های لازم بر روی الگوریتم های موجود، یکی از الگوریتم های پایه ای در زمینه مقایسه و تطابق اسامی انتخاب شده و برای زبان فارسی تغییر و بهینه سازی شده است. در نهایت الگوریتم طراحی شده، اسامی زبان فارسی را به عنوان ورودی گرفته و در خروجی درصد شباهت آنها به یکدیگر را مشخص می کند. این الگوریتم برای تعیین و برآورد شباهت بین دو اسم، شباهت آنها را از سه منظر صوتی، نوشتاری و نمایش حروف به کار رفته و نزدیکی حروف آنها بر روی کیبورد، بررسی و لحاظ می کند و بعد از انجام عملیات محاسباتی، در نهایت احتمال یکی بودن اسامی را به درصد بیان می کند. کارایی این الگوریتم در راستای این که بتواند برای حجم بالای داده بانکی به صورت موثر کار کند، از اهمیت بالایی برخوردار بوده است.

کلیدواژه ها

الگوریتم تطابق اسامی، کاربرد، تشخیص تقلب، مدیریت ارتباط با مشتری، ضد پولشویی، رتبه بندی اعتباری، ذینفع واحد

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.