برچسب زنی آماری کلمات فارسی با استفاده از وندها

علی اصغر بهمنش; امیر سالارپور; عبدالحمید پیله ور

برچسب زنی آماری کلمات فارسی با استفاده از وندها

محل انتشار: اولین کنفرانس ملی محاسبات نرم و فن آوری اطلاعات

سال انتشار: 1389

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,360

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

صنعت اتصال > چسب و رزین

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/132778

شناسه ملی سند علمی:

NCSCIT01_073

تاریخ نمایه سازی: 19 بهمن 1390

چکیده مقاله:

یکی از اقدامات اساسی در حوزه پردازش زبانهای طبیعی برچسب زنی کلمات می باشد.برچسب ها در حوزه های پردازش گفتار (تبدیل متن به گفتار و برعکس), ماشین مترجم ] ریشه یاب ها و دیگر کاربردهی پردازش زبان استفاده می شود .در این مقاله سعی شده است تاکلمات به وسیله تکنیک های آماری روی پیکره فارسی بیجین خان به درستی برچسب گزاری شوند.روش های آماری یکی از ابتدایی ترین روش برچشب زنی استکه علاوه بر سادگی , دقت قابل قبولی نیز دارد.برای اینکه برچسب صحیحی به کلمات داده شود.لازم است کلمات از نظر ساختاری مورد بررسی و پردازش قرار بگیرند. به همین دلیل قبل از برچسب زنی کلمات , ساختار کلمه از لحاظ پیشوندی و پسوندی پیش پردازش شده اند و برچسب با توجه به وندهای موجود در کلمه انتخاب می شود.بنابراین دقت برچسب زنی افزایش می یابد.روش ارائه شده در این مقاله 96.07% صحت را برای برچسب زنی روی پیکره نشان می دهد که نسبت به روش های مشابه دقتی بهتری دارد.

کلیدواژه ها:

پردازش زیان طبیعی ، برچسب زنی کلمات ، ÷ردازش زبان فارسی ، تخمین بیشینه احتمال

نویسندگان

علی اصغر بهمنش

گروه کامپیوتر - دانشگاه بوعلی سینا

امیر سالارپور

گروه کامپیوتر - دانشگاه بوعلی سینا

عبدالحمید پیله ور

گروه کامپیوتر - دانشگاه بوعلی سینا همدان

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

.M. BijanKhan.. The Role of the Corpus in Writing a ...
E. Brill, _ Simple Rule-Based Part-of-Speech Tagger", in Proceedings Third ...
D. Cutting, J. Kupiec, J. Pedersen and P. Sibun, :A ...
J. L. Elman, "Finding Structure in Time", Cognitive Science 14, ...
H. Schmid, Part-of-Speech Tagging with Neural Networks, Proceedings of the ...
F. Oroumchian, S. Tasharofi, H. Amiri, H. Hojjat and F. ...
.F. Raja, H. Amiri , S. Tasharofi, M. Sarmadi and ...
_ D. Jurafsky and J. H. Martin., Speech and Language ...
C.D. Manning and H.Sch:utze, Foundations of Statistical Natural Language Processing, ...

نمایش کامل مراجع