امکانات و کاستی های ستاک یابی فارسی در پردازش زبان طبیعی

مریم اسدی; ویدا شقاقی; محسن کاهانی

امکانات و کاستی های ستاک یابی فارسی در پردازش زبان طبیعی

محل انتشار: فصلنامه مطالعات زبان و گویش های غرب ایران، دوره: 13، شماره: 1

سال انتشار: 1404

نوع سند: مقاله ژورنالی

زبان: فارسی

مشاهده: 176

فایل این مقاله در 18 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/2196382

شناسه ملی سند علمی:

JR_JLW-13-1_001

تاریخ نمایه سازی: 20 اسفند 1403

چکیده مقاله:

برای سرعت بخشیدن و آسانی انتقال و گسترش دانش، فرایندهای ذخیره و مبادله اطلاعات خودکارسازی می شوند. پردازش زبان طبیعی از محورهای این خودکارسازی است. زبان شناسان نظری می توانند در پیشبرد مطالعات پردازش زبان طبیعی نقش تاثیرگذاری ایفا کنند. آن ها باتکیه بر دستاوردهای مطالعات زبان شناختی می توانند با شناسایی شباهت های زبان ها به یکدیگر ابزاری را که متخصصان پردازش زبان طبیعی برای زبانی مشخص طراحی کرده اند، براساس شباهت برای زبان دیگری پیشنهاد دهند. به عبارتی، زبان شناسان نظری می توانند به تعمیم نتایج پژوهش های پردازش زبان طبیعی کمک کنند. در این مقاله، رویکردهای ستاک یابی زبان فارسی ازمنظر زبان شناسی نظری مطالعه و تحلیل شده اند. تحلیل صرفی از مراحل پردازش زبان طبیعی است که به صورت کلمه می پردازد. ستاک یابی نیز از مراحل اصلی تحلیل صرفی است که بر کاهش صورت واژه تصریف شده یا واژه مشتق تا رسیدن به ریشه یا ستاک تمرکز دارد. ازنظر زبانی، غنای صرفی، مسائل خط فارسی و منابع محدود باعث شده اند ستاک یابی در زبان فارسی به پژوهشی دشوار تبدیل شود. پیمودن این مراحل دشوار در گرو طراحی روش هایی کارآمد برای مولفه های خاص زبان فارسی است. پس از تحلیل رویکردهای مختلف ستاک یابی همچون رویکردهای ساختاری، آماری و یادگیری عمیق برای زبان هایی با مسائل مشابه مسائل زبان فارسی، ستاک یابی با استفاده از الگوی دنباله به دنباله برای زبان فارسی پیشنهاد می شود.

کلیدواژه ها:

صرف ، تحلیل صرفی ، زبان فارسی ، ستاک یابی ، پردازش زبان طبیعی ، پیش پردازش ، الگوی دنباله به دنباله

نویسندگان

مریم اسدی

دانشجوی دکتری زبان شناسی، گروه زبان شناسی، دانشکده ادبیات و زبان های خارجی، دانشگاه علامه طباطبائی، تهران، ایران.

ویدا شقاقی

استاد، گروه زبان شناسی، دانشکده ادبیات و زبان های خارجی، دانشگاه علامه طباطبائی، تهران، ایران.

محسن کاهانی

استاد، گروه مهندسی کامپیوتر، دانشکده فنی و مهندسی، دانشگاه فردوسی، مشهد، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

اسلامی، محرم (۱۳۸۱). دشواری های پردازش رایانه ای خط فارسی. ...
دبیرمقدم، محمد (۱۳۸۴). پژوهش های زبان شناختی فارسی (مجموعه مقالات). ...
شقاقی، ویدا ([۱۳۸۶] ۱۳۹۲). مبانی صرف. تهران: سمت ...
شقاقی، ویدا (۱۳۹۴). فرهنگ توصیفی صرف. تهران: علمی ...
نساجیان، مینو؛ شجاعی، راضیه؛ بحرانی، محمد (۱۳۹۸). ساخت اضافه در ...

نمایش کامل مراجع