گزارشی از ساخت نخستین پیکره چند زبانه برای زبان فارسی
محل انتشار: دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران
سال انتشار: 1385
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,853
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ACCSI12_086
تاریخ نمایه سازی: 23 دی 1386
چکیده مقاله:
این مقاله، اولین پیکره فارسی موازی با تعداد زیادی از زبان های اروپایی را معرفی می نماید. این مقاله، اولین قدم ها را برای ساخت منابع اساسی جهت پردازش زبان فارسی معرفی می نمای د . این مرحله از کار شامل معرفی ویژگی های صرف ی -نحوی زبان فارسی و رمزنگاری آنها بر پایه مدلEAGLES/MULTEXT و منابع خاص MULTEXT-East می باشد. این مقاله پس از معرفی مختصر زبان فارسی، با تاکید بر شیوه نگارش و ویژگی های صرفی-نحوی آن، به ارائه یک دسته بندی جدید برای مقوله های گفتاری فارسی پرداخته و رسم الخطی را جهت ارائه فارسی در محیط دیجیتال ارائه می نمای د . پس از آن آماری از پیکره ساخته شده ارائه می شو د . کار صورت گرفته منحصرا توسط افراد داوطلب و بدون هیچگونه پشتیبانی مالی و یا معنوی از سازمان خاص صورت گرفته است.
کلیدواژه ها:
پیکره ، زبانشناسی رایانه ای ، ویژگی های صرفی-نحوی ، فارسی ، حاشیه نویسی پیکره ها ، پردازش زبان طبیعی
نویسندگان
بهرنگ قاسمی زاده
سرپرست تیم پدیدآورندگان پیکره ، کارشناس ارشد هوش مصنوعی، شرکت ف نآوری
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :