ایجاد پایگاه داده متون فارسی مناسب کاربردهای ابهام زدایی معنایی کلمات

محمدرضا محمودوند; مریم حورعلی

ایجاد پایگاه داده متون فارسی مناسب کاربردهای ابهام زدایی معنایی کلمات

محل انتشار: دومین همایش ملی مهندسی رایانه و مدیریت فناوری اطلاعات

سال انتشار: 1394

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 690

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > پردازش زبان طبیعی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/422966

شناسه ملی سند علمی:

CSITM02_205

تاریخ نمایه سازی: 25 بهمن 1394

چکیده مقاله:

یافتن یک مجموعه دادگان مناسب برای کاربردهای پردازش زبان طبیعی یکی از چاال هاای پای روی پژوهشگران این حوزه میباشد. این مشکل در زبانهای غیر لاتین و بخصوص فارسی نیز بیش از پیش بزرگ جلوه میکند. وجود یک مجموعه دادهمناسب که بتوان از آن در توسعه برنامههای کاربردی حوزه پردازش زبان استفاده کرد، نتایج بدست آمده را قابل استناد نموده و امکان مقایسه و بررسی دقیق پژوه ها میسر خواهد شد. در این مقاله روند استخراج یاک مجموعه دادگان استاندارد به زبان فارسی ارائه شده است. این مجموعه تنها برای استفاده در پژوه هایی زوزه ابهام زدایی معنایی کلماات فارسی کاربرد خواهدداشت. اسناد موجود که شامل کلمات هدف مبهم میباشد توسط یک ربات خزنده گردآوری شده و پس از پس پردازش در بانک اطلاعاتی دادگان فارسی کلمات مبهم ثبت میگردد. کلمه هدف در این پژوه کلمه مبهم متداول شیر بارای استخراج متون فارسی مناسب استفاده شده است. در نهایت یک چهارچوب برای ایجاد پیکره مناسب و همچنین کاربردی برای استفاده در مسائل ابهام زدایی معنایی کلمات ارائه میگردد

کلیدواژه ها:

پردازش زبان طبیعی ، ابهام زدایی معنایی کلمات ، استخراج اطلاعات ، پیکره فارسی ، ساخت پیکره آزمایش

نویسندگان

محمدرضا محمودوند

دانشجوی کارشناسی ارشد هوش مصنوعی دانشگاه صنعتی مالک اشتر.

مریم حورعلی

استادیار و عضو هیات علمی دانشگاه صنعتی مالک اشتر، مجتمعICT

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

Tayebeh Mousav Miangah. _ Sense Disambiguation Using Target Language Corps ...
Amir Hossein Rasekh, Mohammad Hadi Sadreddini, Seyed Mostafa Fakhrahmad, "Word ...
P arame swarappa, S. Narayana, V.N., "Target Word Sense D ...
Broda, B.; Mazur, W., "Evaluation of clustering algorithms for Polish ...
Azzini, A.; Pereira, C.; Dragoni, M.; Tettamanzi, A. G B, ...
Riahi, N.; Sedghi, F., "A Semi- Supervised method for Persian ...
Pengyuan Liu, "Another View of the Features in Supervised Chinese ...
Ilgen, B.; Adali, E.; Tantug, A.C., "The impact _ collocational ...
BijanKhan, M., The role of the corpus in writing a ...
Abolfazl AleAhmad _ Hadi Amiri , Ehsan Darrud _ Masoud ...
M Hamidi, A Borjiz, SS Ghidary , Persian word _ ...
A. R. Rezapour, S. M. Fakhrahmad and M. H. Sadreddini ...

نمایش کامل مراجع