یک الگوریتم بر پایه درهم سازی در تطبیق رشته بر روی آپاچی هدوپ

  • سال انتشار: 1403
  • محل انتشار: اولین کنفرانس بین المللی دوسالانه هوش مصنوعی و علوم داده
  • کد COI اختصاصی: DSAI01_033
  • زبان مقاله: فارسی
  • تعداد مشاهده: 139
دانلود فایل این مقاله

نویسندگان

محمدمهدی قاسمی نیا

دانشجوی دکتری، بخش علوم کامپیوتر، دانشکده علوم ریاضی، دانشگاه یزد، یزد، ایران

سیدابوالفضل شاهزاده فاضلی

دانشیار بخش علوم کامپیوتر، دانشکده علوم ریاضی، دانشگاه یزد، یزد، ایران

جمال زارع پوراحمدی آبادی

استادیار بخش علوم کامپیوتر، دانشکده علوم ریاضی، دانشگاه یزد، یزد، ایران

چکیده

الگوریتم پیشنهادی به دنبال استفاده از روش های درهم سازی در تطبیق رشته ها بر روی پلتفرم آپاچی هدوپ با استفاده از نگاشت وکاهش است. به این منظور از تابع BLAKE۳ که یک تابع درهم ساز مدرن و پرسرعت است، استفاده شده است. علاوه بر این، تکنیک نگاشت و کاهش بر روی پلتفرم هدوپ برای افزایش عملکرد تطبیق بهره برداری شده است. این الگوریتم برای متن های در مقیاس بزرگ مناسب استو می تواند برای طیف گسترده ای از کاربردها مانند شباهت متن، بازیابی اطلاعات و پردازش زبان طبیعی و کلا نداده ها مورد استفاده قرار گیرد.

کلیدواژه ها

تطبیق رشته، توابع درهم ساز، آپاچی هدوپ، پردازش متن

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.