مرور و تحلیل فعالیت های پردازش زبان و خط فارسی (تاکید بر پیکره های زبانی و نرم افزارهای تولیدشده)

سال انتشار: 1396
محل انتشار: اولین کنفرانس ملی کاربرد پژوهش های نوین در علوم انسانی
کد COI اختصاصی: AMRH01_082
زبان مقاله: فارسی
تعداد مشاهده: 905

نویسندگان

مدیر گروه علم اطلاعات و دانش شناسی، واحد بابل، دانشگاه آزاد اسلامی، بابل، ایران

دانشجوی دکتری علم اطلاعات و دانش شناسی، واحد بابل، دانشگاه آزاد اسلامی، بابل،ایران

چکیده

پردازش زبان فارسی یک نیاز ملی و بین المللی است که به رغم تفاوت مشهود تلاش های صورت گرفته در ایران و کشورهای دیگر بر روی پردازش رایانه ای زبان فارسی، نیازهای بسیاری در این زمینه به چشم می خورد. این مقاله ضمن معرفی فعالیت های صورت گرفته در حوزه زبان و خط فارسی، با تجزیه، تحلیل و مقایسه عملکردی نرم افزارها و پیکره های تولیدشده ضرورت تولید و تدوین نرم افزارها و پیکره های زبانی فارسی بومی، متناسب با زبان، فرهنگ و آداب ورسوم کشورمان ایران را نشان داده و متذکر خواهد شد که با گسترش طرح جویشگر بومی این نیاز تا حد زیادی مرتفع شود. همچنین انتظار می رود با ارایه پیشنهاد وضع مطلوب نرم افزارها و پیکره های زبانی فارسی در تحقیقات مربوط به پردازش زبان طبیعی و بازیابی اطلاعات، محققان و پژوهشگران این حوزه بتوانند گام های عملی در جهت بهبود شرایط موجود بردارند.

کلیدواژه ها

پیکره های زبانی، پردازش زبان طبیعی،زبان فارسی، دادگان، نرم افزارهای زبان طبیعی

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.