شناسایی محل کسره اضافه در زبان فارسی با استفاده از گرامر مستقل از متن احتمالاتی

شهریار عیسی پور; محمدمهدی همایون پور; محمود بی جن خان

شناسایی محل کسره اضافه در زبان فارسی با استفاده از گرامر مستقل از متن احتمالاتی

محل انتشار: سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران

سال انتشار: 1386

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 4,575

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/41694

شناسه ملی سند علمی:

ACCSI13_100

تاریخ نمایه سازی: 25 آبان 1386

چکیده مقاله:

در این مقاله به ارائه روشی برای شناسایی کسره اضافه در متون فارسی، با استفاده از گرامر مستقل ازمتن احتمالاتی و آمار کلمات، همراه با آنالیز لغوی پرداخته می شود. پس از تبیین اهمیت مسئله با ارائه چند جمله نمونه و توضیح نظریات زبانشناسی پیرامون حوضه اضافه و بررسی این حوضه از نظر تلحیل نحوی و قواعد دستوری زبان فارسی، به بیان روش پیشنهادی و ارائه نتایج حاصل از تست آن با استفاد ه از 1000 جمله معیار پرداخته ایم. در روش بکار رفته، ابتدا با توجه به قوانین گرامری زبان فارسی و خصوصیات کسره اضافه که از بررسی نتایج بدست امده توسط زبانشناسان در رابطه با حوزه اضافه حاصل گردیده، سعی شده است تا با تولید بانک درختی ازگروه های اسمی در زبان فارسی و آموزش گرامر مستقل از متن احتمالاتی با استفاده از این بانک درخت، و همچنین پارسر پایین به بالا، کلیه گروه های اسمی جملات ورودی استخراج شده و گروه های با احتمال بالاتر انتخاب شوند. سپس با استفاده از آنالیز لغوی کلمات و استفاده از احتمال کسره دار بودن هر کلمه و همچنین استفاده از گروه های اسمی انتخاب شده در فاز قبل و کمک گرفتن ازکلمات قبل و بعد کلمه مورد نظر و با استفاده از دو درخت تصمیم، کسره دار بودن یا نبودن هر کلمه موجود درجمله ورودی مشخص می گردد، کارایی بدست امده بر اساس ضریب کاپا برابر 0/74 است که بهتر از نتایج بدست امده در تحقیقات قبلی در این زمینه می باشد، ضمن اینکه مجموعه تست مورد استفاده با داشتن 1000 جمله نسبت به مجموعه تست تحقیقات قبلی دارای تعداد جملات و تنوع بیشتر موضوعات می باشد.

کلیدواژه ها:

کسره اضافه ، حوزه اضافه ، گروه اسمی ، گرامر PCFG ، آنالیز لغوی ، آنالیز نحوی ، چارت پارسر ، درخت CART ، زبانشناسی نظری

نویسندگان

شهریار عیسی پور

دانشجوی کارشناسی ارشد آزمایشگاه سیستم های هوش صوتی - گفتاری، دانشگاه م

محمدمهدی همایون پور

عضو هیات علمی آزمایشگاه سیستم های هوش صوتی - گفتاری، دانشگاه مهندسی کا

محمود بی جن خان

عضو هیات علمی دانشکده ادبیات و علوم انسانی، دانشگاه تهران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

باطنی، محمد رضا، توصیف ساختاری زبان فارسی، چاپ شانزدهم، انتشارات ...
بیجن خان، تشخیص کسره اضافه با استفاده از روش انطباق ...
لیرمدی، نحو زبان فارسی (بر پایه نظریه حاکمیت و مرجع ...
حسن احمدی گیوی، حسن انوری، دستور زبان فارسی، چاپ بیست ...
آرزو معظمی، علی درزی، ساخت حوزه اضافه در گروه اسمی ...
Lazard, G. La Langue des plus Anciens Monuments de la ...
Ghomeshi, J. Non -projecting nouns and the ezafe- construction in ...
Holmberg, A. and D. Odden. The izafe and NP structure ...
Revisited: evidence for Modifier Phrase". Paper presented at Proceedings of ...
Larson, R. and H. Yamakido. Zazaki Double Ezafe as Double ...
Samvelian, P. "When morphology does better than Syntax: The Ezafe ...
Samiian, V. The Ezafe Construction: Some Implications for the Theory ...
Me gerdoomian, K. A Computational Analysis of the Persian Noun ...
Aoife, A. Mair, C. McCarthy, E. van, J. Parsing with ...
Carletta J. C., Assessing agreement _ classification tasks: the kappa ...
A Koocharia, B Q asemiZadehb, "Ezafe Prediction in Phrases of ...

نمایش کامل مراجع