برچسب زنی آماری کلمات فارسی با استفاده از وندها
محل انتشار: اولین کنفرانس ملی محاسبات نرم و فن آوری اطلاعات
سال انتشار: 1389
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,360
فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NCSCIT01_073
تاریخ نمایه سازی: 19 بهمن 1390
چکیده مقاله:
یکی از اقدامات اساسی در حوزه پردازش زبانهای طبیعی برچسب زنی کلمات می باشد.برچسب ها در حوزه های پردازش گفتار (تبدیل متن به گفتار و برعکس), ماشین مترجم ] ریشه یاب ها و دیگر کاربردهی پردازش زبان استفاده می شود .در این مقاله سعی شده است تاکلمات به وسیله تکنیک های آماری روی پیکره فارسی بیجین خان به درستی برچسب گزاری شوند.روش های آماری یکی از ابتدایی ترین روش برچشب زنی استکه علاوه بر سادگی , دقت قابل قبولی نیز دارد.برای اینکه برچسب صحیحی به کلمات داده شود.لازم است کلمات از نظر ساختاری مورد بررسی و پردازش قرار بگیرند. به همین دلیل قبل از برچسب زنی کلمات , ساختار کلمه از لحاظ پیشوندی و پسوندی پیش پردازش شده اند و برچسب با توجه به وندهای موجود در کلمه انتخاب می شود.بنابراین دقت برچسب زنی افزایش می یابد.روش ارائه شده در این مقاله 96.07% صحت را برای برچسب زنی روی پیکره نشان می دهد که نسبت به روش های مشابه دقتی بهتری دارد.
کلیدواژه ها:
نویسندگان
علی اصغر بهمنش
گروه کامپیوتر - دانشگاه بوعلی سینا
امیر سالارپور
گروه کامپیوتر - دانشگاه بوعلی سینا
عبدالحمید پیله ور
گروه کامپیوتر - دانشگاه بوعلی سینا همدان
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :