یک مدل بازنمایی برداری واژگان برای ترجمه ی ماشینی انگلیسی به فارسی با استفاده از یادگیری ژرف
- سال انتشار: 1395
- محل انتشار: کنفرانس بین المللی مهندسی و علوم کامپیوتر
- کد COI اختصاصی: ICCSE01_271
- زبان مقاله: فارسی
- تعداد مشاهده: 1011
نویسندگان
دانشجو، علوم ریاضی و رایانه، دانشگاه علامه طباطبایی، تهران
استادیار، گروه علوم کامپیوتر، دانشگاه شهید بهشتی، تهران
استادیار، علوم ریاضی و رایانه، دانشگاه علامه طباطبایی، تهران
چکیده
یادگیری عمیق رویکرد جدیدی در زمینه ی یادگیری ماشین است. یادگیری عمیق دیدگاه نوینی برای ترجمهی ماشینی فراهم کرده است.این دیدگاه به ترجمه ی ماشینی عصبی معروف است. آموزش یکپارچه ی این سیستم ها برای ترجمه ی ماشینی انگلیسی به فارسی، نیازبه پیکره ی متنی موازی بزرگ دارد. متاسفانه در زبان فارسی چنین پیکاره ی متنی بزرگی در دستری نیست. باعنوان یک راه حالجایگزین، داده ی متنی بزرگ فارسی، برای بازنمایی برداری واژگان جمع آوری شد. برای بازنمایی برداری واژگان از روشWord2Vec استفاده شد. دو پارامتر بعد فضای برداری و حجم مجموعه دادگان در بازنمایی برداری واژگان در روش Word2Vecتاثیر داشتند. مجموعه تستی برای ارزیابی بازنمایی برداری واژگان با استفاده از معیار شباهت کسینوسی ارایه شد. بردارهایبه دست آمده از روش Word2Vec روی مجموعه تست تعریف شده برای زبان فارسی، ازلحاظ شباهت معنایی و نحوی واژگان عملکردقابل توجهی به نمایش گذاشت.کلیدواژه ها
بازنمایی برداری واژگان، Word2Vec ، ترجمه ی ماشینی عصبی، یادگیری عمیق، پردازش زبان طبیعیمقالات مرتبط جدید
- مرور سیستماتیک کاربرد هوش مصنوعی در موسیقی
- In-silico Analyses for Finding Potential Key Genes and Pathways Associated with Guillain-Barré Syndrome Using Computational Tools
- OCD Severity Based on EEG Signals
- Investigating the (non) -Impact of Customizing Knowledge Bases of Artificial Intelligence -Driven Robot on Language for Specific Purposes Learning
- The Need for Telehealth and Tele-Educationon in Optimizing Measles Surveillance and Reducing Healthcare Costs
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.