امکانات و کاستی های ستاک یابی فارسی در پردازش زبان طبیعی
سال انتشار: 1404
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 76
فایل این مقاله در 18 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_JLW-13-1_001
تاریخ نمایه سازی: 20 اسفند 1403
چکیده مقاله:
برای سرعت بخشیدن و آسانی انتقال و گسترش دانش، فرایندهای ذخیره و مبادله اطلاعات خودکارسازی می شوند. پردازش زبان طبیعی از محورهای این خودکارسازی است. زبان شناسان نظری می توانند در پیشبرد مطالعات پردازش زبان طبیعی نقش تاثیرگذاری ایفا کنند. آن ها باتکیه بر دستاوردهای مطالعات زبان شناختی می توانند با شناسایی شباهت های زبان ها به یکدیگر ابزاری را که متخصصان پردازش زبان طبیعی برای زبانی مشخص طراحی کرده اند، براساس شباهت برای زبان دیگری پیشنهاد دهند. به عبارتی، زبان شناسان نظری می توانند به تعمیم نتایج پژوهش های پردازش زبان طبیعی کمک کنند. در این مقاله، رویکردهای ستاک یابی زبان فارسی ازمنظر زبان شناسی نظری مطالعه و تحلیل شده اند. تحلیل صرفی از مراحل پردازش زبان طبیعی است که به صورت کلمه می پردازد. ستاک یابی نیز از مراحل اصلی تحلیل صرفی است که بر کاهش صورت واژه تصریف شده یا واژه مشتق تا رسیدن به ریشه یا ستاک تمرکز دارد. ازنظر زبانی، غنای صرفی، مسائل خط فارسی و منابع محدود باعث شده اند ستاک یابی در زبان فارسی به پژوهشی دشوار تبدیل شود. پیمودن این مراحل دشوار در گرو طراحی روش هایی کارآمد برای مولفه های خاص زبان فارسی است. پس از تحلیل رویکردهای مختلف ستاک یابی همچون رویکردهای ساختاری، آماری و یادگیری عمیق برای زبان هایی با مسائل مشابه مسائل زبان فارسی، ستاک یابی با استفاده از الگوی دنباله به دنباله برای زبان فارسی پیشنهاد می شود.
کلیدواژه ها:
نویسندگان
مریم اسدی
دانشجوی دکتری زبان شناسی، گروه زبان شناسی، دانشکده ادبیات و زبان های خارجی، دانشگاه علامه طباطبائی، تهران، ایران.
ویدا شقاقی
استاد، گروه زبان شناسی، دانشکده ادبیات و زبان های خارجی، دانشگاه علامه طباطبائی، تهران، ایران.
محسن کاهانی
استاد، گروه مهندسی کامپیوتر، دانشکده فنی و مهندسی، دانشگاه فردوسی، مشهد، ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :