ناشر تخصصی کنفرانس های ایران

لطفا کمی صبر نمایید

Publisher of Iranian Journals and Conference Proceedings

Please waite ..
CIVILICAWe Respect the Science
ناشر تخصصی کنفرانسهای ایران
عنوان
مقاله

Improving Persian Word Embeddings Using Cross-Lingual Joint Space

سال انتشار: 1398
کد COI مقاله: ICIKT10_059
زبان مقاله: انگلیسیمشاهد این مقاله: 375
متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

خرید و دانلود فایل مقاله

متن کامل (فول تکست) این مقاله منتشر نشده و یا در سایت موجود نیست و امکان خرید آن فراهم نمی باشد.

مشخصات نویسندگان مقاله Improving Persian Word Embeddings Using Cross-Lingual Joint Space

Mohammad Aliramezani - Student Computational Linguistics Group Sharif University of Technology Tehran, Iran
Mohammad Hadi Bokaei - Assistant Professor Information Technology Department ICT Research Institute Tehran, Iran
Hossein Sameti - Associate Professor Computer Engineering Department Sharif University of Technology Tehran, Iran

چکیده مقاله:

In this paper, cross-lingual word embeddings method is introduced to improve quality of monolingual Persian word embeddings. The main idea of the paper is that as Persian is low resource language, a high resource language like English can enhance Persian word embeddings in a cross-lingual space. Therefore, English monolingual word embeddings are used to create a joint space with Persian one. MUSE and VecMap method as the two state of the art approaches are applied to transfer Persian word embeddings to English word embeddings space in a supervised mode. A 5k bilingual English-Persian is utilized as the supervision. In addition, the English Kudkudak evaluation benchmark is customized to assess Persian monolingual word embeddings. The customized benchmark evaluates word embeddings in three tasks, namely categorization, analogy, and word similarity. According to analysis, the cross-lingual transfer can increase monolingual Persian word embeddings without any extra train data. In comparison with MUSE, VecMap can align Persian word embeddings to English in a more effective way. As a result, VecMap outperforms MUSE in enhancing Persian word embeddings. The Persian cross-lingual word embeddings show improvements in categorization and analogy tasks.

کد مقاله/لینک ثابت به این مقاله

برای لینک دهی به این مقاله می توانید از لینک زیر استفاده نمایید. این لینک همیشه ثابت است و به عنوان سند ثبت مقاله در مرجع سیویلیکا مورد استفاده قرار میگیرد:

https://civilica.com/doc/982294/

نحوه استناد به مقاله:

در صورتی که می خواهید در اثر پژوهشی خود به این مقاله ارجاع دهید، به سادگی می توانید از عبارت زیر در بخش منابع و مراجع استفاده نمایید:
Aliramezani, Mohammad and Bokaei, Mohammad Hadi and Sameti, Hossein,1398,Improving Persian Word Embeddings Using Cross-Lingual Joint Space,دهمین کنفرانس فناوری اطلاعات و دانشIKT2019,تهران,,,https://civilica.com/doc/982294

در داخل متن نیز هر جا که به عبارت و یا دستاوردی از این مقاله اشاره شود پس از ذکر مطلب، در داخل پارانتز، مشخصات زیر نوشته می شود.
برای بار اول: (1398, Aliramezani, Mohammad؛ Mohammad Hadi Bokaei and Hossein Sameti)
برای بار دوم به بعد: (1398, Aliramezani؛ Bokaei and Sameti)
برای آشنایی کامل با نحوه مرجع نویسی لطفا بخش راهنمای سیویلیکا (مرجع دهی) را ملاحظه نمایید.

مدیریت اطلاعات پژوهشی

صدور گواهی نمایه سازی | گزارش اشکال مقاله | من نویسنده این مقاله هستم

اطلاعات استنادی این مقاله را به نرم افزارهای مدیریت اطلاعات علمی و استنادی ارسال نمایید و در تحقیقات خود از آن استفاده نمایید.

علم سنجی و رتبه بندی مقاله

مشخصات مرکز تولید کننده این مقاله به صورت زیر است:
نوع مرکز: دانشگاه دولتی
تعداد مقالات: 13,479
در بخش علم سنجی پایگاه سیویلیکا می توانید رتبه بندی علمی مراکز دانشگاهی و پژوهشی کشور را بر اساس آمار مقالات نمایه شده مشاهده نمایید.

مقالات پیشنهادی مرتبط


مقالات فوق بر اساس داده کاوی مقالات مطالعه شده توسط پژوهشگران محاسبه شده است.

مقالات مرتبط جدید

به اشتراک گذاری این صفحه

اطلاعات بیشتر درباره COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.

پشتیبانی