ترجمه ماشینی آماری با استفاده از برچسب های کم عمق نحوی
- سال انتشار: 1395
- محل انتشار: هشتمین کنفرانس بین المللی فناوری اطلاعات ودانش
- کد COI اختصاصی: ICIKT08_052
- زبان مقاله: فارسی
- تعداد مشاهده: 1123
نویسندگان
دانشگاه شهید بهشتی، دانشکده مهندسی و علوم کامپیوتر
دانشگاه شهید بهشتی، دانشکده مهندسی و علوم کامپیوتر
چکیده
این مقاله مدل سلسله مراتبی جدیدی را برای ترجمه ماشینی آماری پیشنهاد می دهد که غیرپایانه ها را با تطابق مرز عبارات مقصد با برچسب هایکم عمق نحوی در سمت مقصد پیکره آموزش، نامگذاری می کند. در جایی که برچسبی برای کل عبارت موجود نباشد، نام غیرپایانه از اتصالبرچسب های مرزی تعریف می شود. برچسب گذاری با کلاس کلمات مرزی عبارات قبلا معرفی گردیده است که می تواند شکل مبنای مدلپیشنهادی درنظر گرفته شود. ما این شکل مبنا را در مقاله حاضر با استفاده از برچسب قطعات توسعه می دهیم. در این توسعه، اگر برچسب قطعهدر مرز عبارت وجود نداشته باشد، از برجسب POS کلمه مرزی استفاده می شود. با استفاده از برچسب عبارات به جای کلاس کلمات، قواعد مدلپیشنهادی تعمیم داده می شود. تعدادی آزمایش در ترجمه فارسی به انگلیسی انجام شد. با استفاده از معیار BLEU در قیاس با مدل SAMTکه از درخت تجزیه نحوی برای برچسب گذاری استفاده می کند، مدل پیشنهادی بهبود قابل توجهی به دست آورد.کلیدواژه ها
ترجمه ماشینی آماری، مدل سلسله مراتبی، برچسب کلمه، برچسب قطعهمقالات مرتبط جدید
- طبقه بندی صفحات وب برای بهینه سازی موتورهای جستجو با استفاده از مدل ترکیبی یادگیری عمیق
- تحول دیجیتال با قراردادهای هوشمند بر پایه فناوری بلاکچین
- تحلیل و شناسایی آسیبپذیریهای ناش ی از حملات شرایط رقابتی در برنامه های وب مدرن
- مروری بر الگوریتم بهینه سازی ازدحام ذرات و کاربردها
- بهینه سازی زمانبندی و ذخیره سازی نتایج وظایف در محیطهای مه-ابر با یادگیری تقویتی
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.