بهبود برچسب زنی متون فارسی با استفاده از روش های ترکیبی نحوی و معنایی
سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 590
فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
MAYCOMP02_075
تاریخ نمایه سازی: 4 مهر 1396
چکیده مقاله:
یکی از ملزومات استفاده از روش های آماری در پردازش زبان طبیعی، دسترسی به داده های زبانی شامل پیکره های متنی، پیکره های درختی، واژگان ها، بانک های صوتی و غیره می باشد. از سوی دیگر، بسیاری از زبان شناسان در پژوهش های خود از پیکره های زبانیبهره می گیرند و به بررسی ویژگی ها و کشف قواعد زبان از طریق اطلاعات موجود در داده های زبانی می پردازند. هدف از این پژوهش، بررسی چالش ها و مشکلات برچسب گذاری خودکار اجزای واژگانی کلام در زبان فارسی و استفاده از پیکره متنی زبان فارسی )پیکرهوابستگی نحوی زبان فارسی(در طراحی یک سیستم، برچسب گذاری می باشد. در این تحقیق، مدل های ترکیبی معرفی خواهند شد که بتوانند دو مسیله ی برچسب زنی اجزای سخن و تجزیه ی وابستگی را به صورت همزمان انجام دهند و در بهبود دقت برچسب زنی، تاثیر مثبتی داشته باشند. در روش پیشنهادی تلاش بر این است که با استفاده از برچسب زن نحوی ومعنایی اجزای کلام، بعد از تعیین نقش کلمات، در مدل یادگیری، برای عملکرد بهتر از چند الگوریتم یادگیری با بهترین دقت استفاده شود. الگوریتمهایی بکار رفته شامل الگوریتم های j48 ,oneR ,bysenet, navebyse میباشند.
کلیدواژه ها:
نویسندگان
فریناز رشادی
دانشجوی کارشناسی ارشد ، گروه کامپیوتر ، واحد میبد ، دانشگاه آزاد اسلامی ، میبد ، ایران
محمدجواد کارگر
عضو هیات علمی گروه کامپیوتر ، واحد میبد ، دانشگاه آزاد اسلامی ، میبد ، ایران