ارایه یک ریشه یاب کلمات فارسی، با استفاده از عبارات باقاعده

  • سال انتشار: 1397
  • محل انتشار: سومین کنفرانس بین المللی مهندسی برق
  • کد COI اختصاصی: ICELE03_263
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1209
دانلود فایل این مقاله

نویسندگان

علی ریحانیان

دانشجوی دکتری تخصصی هوش مصنوعی و رباتیکز، گروه مهندسی کامپیوتر، دانشگاه تبریز، تبریز

محمدرضا فیضی درخشی

دانشیار گروه مهندسی کامپیوتر-هوش مصنوعی و رباتیکز، گروه مهندسی کامپیوتر، دانشگاه تبریز، تبریز

علیرضا فیضی درخشی

دانشجوی کارشناسی ارشد مهندسی پزشکی، گروه مهندسی پزشکی، دانشگاه تبریز، تبریز

چکیده

یافتن ریشه کلمات، یکی از مهمترین موضوعات در زمینه پردازش زبان طبیعی به شمار میر ود. ریشه یک کلمه، بهبخشی از آن اطلاق میشود که پس از حذف پیشوند، پسوند و میانوند از آن، حاصل خواهد شد. در این مقاله، با به کارگیریعبارات باقاعده، یک ریشه یاب کلمات فارسی ارایه شده است که طی سه مرحله، به ریشه یابی کلمات موجود در یک پیکرهمی پردازد: 1) جداسازی کلمات موجود در پیکره، 2) اعمال قوانین ریشه یابی بر روی کلمات جداسازی شده و یافتن ریشه هاو 3) تطبیق ریشه های یافت شده با پیکرهای از مجموعه لغات زبان فارسی، به منظور رد کردن ریشه های نامعتبر. نتایجحاصل از ریشه یاب پیشنهادی، بیانگر کارایی بالای آن در ریشه یابی کلمات فارسی می باشد.

کلیدواژه ها

پردازش زبان طبیعی، ریشه یاب، پیکره، عبارات باقاعده

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.