ارایه یک ریشه یاب کلمات فارسی، با استفاده از عبارات باقاعده
- سال انتشار: 1397
- محل انتشار: سومین کنفرانس بین المللی مهندسی برق
- کد COI اختصاصی: ICELE03_263
- زبان مقاله: فارسی
- تعداد مشاهده: 1236
نویسندگان
دانشجوی دکتری تخصصی هوش مصنوعی و رباتیکز، گروه مهندسی کامپیوتر، دانشگاه تبریز، تبریز
دانشیار گروه مهندسی کامپیوتر-هوش مصنوعی و رباتیکز، گروه مهندسی کامپیوتر، دانشگاه تبریز، تبریز
دانشجوی کارشناسی ارشد مهندسی پزشکی، گروه مهندسی پزشکی، دانشگاه تبریز، تبریز
چکیده
یافتن ریشه کلمات، یکی از مهمترین موضوعات در زمینه پردازش زبان طبیعی به شمار میر ود. ریشه یک کلمه، بهبخشی از آن اطلاق میشود که پس از حذف پیشوند، پسوند و میانوند از آن، حاصل خواهد شد. در این مقاله، با به کارگیریعبارات باقاعده، یک ریشه یاب کلمات فارسی ارایه شده است که طی سه مرحله، به ریشه یابی کلمات موجود در یک پیکرهمی پردازد: 1) جداسازی کلمات موجود در پیکره، 2) اعمال قوانین ریشه یابی بر روی کلمات جداسازی شده و یافتن ریشه هاو 3) تطبیق ریشه های یافت شده با پیکرهای از مجموعه لغات زبان فارسی، به منظور رد کردن ریشه های نامعتبر. نتایجحاصل از ریشه یاب پیشنهادی، بیانگر کارایی بالای آن در ریشه یابی کلمات فارسی می باشد.کلیدواژه ها
پردازش زبان طبیعی، ریشه یاب، پیکره، عبارات باقاعدهمقالات مرتبط جدید
- ارزیابی اقتصادی و زیست محیطی سناریوهای ترکیب انرژی تجدیدپذیر در برنامه ریزی تولید برق ایران تا افق ۱۴۱۰
- بررسی فناوریها و استراتژیها برای بهینه سازی مصرف انرژی و افزایش کارایی در شبکه های توزیع
- فناوری اطلاعات و ارتباطات سبز
- Hoo Controller Design for a Quadruple-Tank Multivariable System: Robust Performance via Weighted Sensitivity Shaping
- تاثیر حیاتی همبستگیهای آماری ضعیف بادبار بر قابلیت اطمینان سیستمهای قدرت: دیدگاهی فراتر از مدلهای سنتی
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.