ایجاد پایگاه داده متون فارسی مناسب کاربردهای ابهام زدایی معنایی کلمات
سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 678
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CSITM02_205
تاریخ نمایه سازی: 25 بهمن 1394
چکیده مقاله:
یافتن یک مجموعه دادگان مناسب برای کاربردهای پردازش زبان طبیعی یکی از چاال هاای پای روی پژوهشگران این حوزه میباشد. این مشکل در زبانهای غیر لاتین و بخصوص فارسی نیز بیش از پیش بزرگ جلوه میکند. وجود یک مجموعه دادهمناسب که بتوان از آن در توسعه برنامههای کاربردی حوزه پردازش زبان استفاده کرد، نتایج بدست آمده را قابل استناد نموده و امکان مقایسه و بررسی دقیق پژوه ها میسر خواهد شد. در این مقاله روند استخراج یاک مجموعه دادگان استاندارد به زبان فارسی ارائه شده است. این مجموعه تنها برای استفاده در پژوه هایی زوزه ابهام زدایی معنایی کلماات فارسی کاربرد خواهدداشت. اسناد موجود که شامل کلمات هدف مبهم میباشد توسط یک ربات خزنده گردآوری شده و پس از پس پردازش در بانک اطلاعاتی دادگان فارسی کلمات مبهم ثبت میگردد. کلمه هدف در این پژوه کلمه مبهم متداول شیر بارای استخراج متون فارسی مناسب استفاده شده است. در نهایت یک چهارچوب برای ایجاد پیکره مناسب و همچنین کاربردی برای استفاده در مسائل ابهام زدایی معنایی کلمات ارائه میگردد
کلیدواژه ها:
نویسندگان
محمدرضا محمودوند
دانشجوی کارشناسی ارشد هوش مصنوعی دانشگاه صنعتی مالک اشتر.
مریم حورعلی
استادیار و عضو هیات علمی دانشگاه صنعتی مالک اشتر، مجتمعICT
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :