شباهت یابی بین زبانی جملات فارسی-انگلیسی با استفاده از یادگیری عمیق

mohammad abdous; Behrouz Minaei Bidgoli

شباهت یابی بین زبانی جملات فارسی-انگلیسی با استفاده از یادگیری عمیق

محل انتشار: مجله رایانش نرم و فناوری اطلاعات، دوره: 11، شماره: 1

سال انتشار: 1401

نوع سند: مقاله ژورنالی

زبان: فارسی

مشاهده: 258

فایل این مقاله در 15 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/2100505

شناسه ملی سند علمی:

JR_JSCIT-11-1_002

تاریخ نمایه سازی: 25 مهر 1403

چکیده مقاله:

شباهت یابی معنایی متون یکی از زیرشاخه های پردازش زبان طبیعی محسوب می شود که در چند سال اخیر تحقیقات گسترده ای را به خود معطوف کرده است. سنجش تشابه معنایی بین کلمات یا اصطلاحات، جملات، پاراگراف و اسناد، نقش مهمی در پردازش زبان طبیعی و زبان شناسی رایانشی ایفا می کند. شباهت یابی معنایی متون در سامانه های پرسش و پاسخ، کشف تقلب، ترجمه ماشینی، بازیابی اطلاعات و نظیر آن کاربرد دارد. منظور از شباهت یابی معنایی، محاسبه میزان شباهت معنایی بین دو سند متنی، پاراگراف یا جمله می باشد که به دو صورت تک زبانه و چندزبانه مطرح است. در این مقاله با استفاد از پیکره موازی میزان، برای اولین بار مدل بین زبانی شباهت معنایی جملات فارسی-انگلیسی را ارائه داده و در ادامه مدل خود را با مدل برت چندزبانه مورد آزمون و مقایسه قرار دادیم. نتایج حاکی از آن است که با استفاده از پیکره های موازی می توان کیفیت تعبیه جملات را در دو زبان مختلف بهبود بخشید. در روش پیشنهادی، معیار همبستگی پیرسون بر اساس شباهت کسینوسی بین بردارهای معنایی حاصل از برت چندزبانه از ۶۵ درصد به ۷۳.۷۷ درصد افزایش یافته است. روش پیشنهادی بر جفت زبان عربی-انگلیسی نیز مورد آزمون قرار گرفت که نتایج حاصله بیانگر برتری روش پیشنهادی نسبت به برت چند زبانه است.

کلیدواژه ها:

پردازش زبان طبیعی ، شباهت معنایی ، بین زبانی ، یادگیری عمیق

نویسندگان

mohammad abdous

هوش مصنوعی و رباتیک، دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران، تهران، ایران.

Behrouz Minaei Bidgoli

دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

Manjula, D., and T. V. Geetha. "Semantic search engine." Journal ...
Aliguliyev, Ramiz M. "A new sentence similarity measure and sentence ...
De Boni, Marco, and Suresh Manandhar. "The Use of Sentence ...
Al-Anzi, Fawaz S., and Dia AbuZeina. "Toward an enhanced Arabic ...
Žižka, Jan, and František Dařena. "Automatic sentiment analysis using the ...
Alzahrani, Salha M., Naomie Salim, and Ajith Abraham. "Understanding plagiarism ...
Majumder, Goutam, et al. "Semantic textual similarity methods, tools, and ...
Jaro, Matthew A. "Advances in record-linkage methodology as applied to ...
Winkler, William E. "String Comparator Metrics and Enhanced Decision Rules ...
Nayantara Jeyaraj, M., & Kasthurirathna, D. (۲۰۲۱). MNet-Sim: A Multi-layered ...
Mikolov, Tomas, et al. "Efficient estimation of word representations in ...
Zhu, Ganggao, and Carlos A. Iglesias. "Computing semantic similarity of ...
Pires, Telmo, Eva Schlinger, and Dan Garrette. "How Multilingual is ...
Li, Yuhua, et al. "Sentence similarity based on semantic nets ...
Mihalcea, Rada, Courtney Corley, and Carlo Strapparava. "Corpus-based and knowledge-based ...
Agirre, Eneko, et al. "SemEval-۲۰۱۲ task ۶: A pilot on ...
Agirre, Eneko, et al. "* SEM ۲۰۱۳ shared task: Semantic ...
Agirre, Eneko, et al. "SemEval-۲۰۱۴ task ۱۰: Multilingual semantic textual ...
Islam, Aminul, and Diana Inkpen. "Semantic text similarity using corpus-based ...
Bjerva, Johannes, and Robert Östling. "Cross-lingual learning of semantic textual ...
Tang, Xin, et al. "Improving multilingual semantic textual similarity with ...
Brychcín, Tomáš. "Linear transformations for cross-lingual semantic textual similarity." Knowledge-Based ...
Cer, Daniel, et al. "SemEval-۲۰۱۷ Task ۱: Semantic Textual Similarity ...
Tian, Junfeng, et al. "Ecnu at SemEval-۲۰۱۷ task ۱: Leverage ...
Pennington, Jeffrey, Richard Socher, and Christopher D. Manning. "Glove: Global ...
Wieting, John, et al. "Towards universal paraphrastic sentence embeddings." arXiv ...
Wu, Hao, et al. "BIT at SemEval-۲۰۱۷ Task ۱: Using ...
Shao, Yang. "Hcti at SemEval-۲۰۱۷ task ۱: Use convolutional neural ...
Klementiev, Alexandre, Ivan Titov, and Binod Bhattarai. "Inducing crosslingual distributed ...
Zou, Will Y., et al. "Bilingual word embeddings for phrase-based ...
Mikolov, Tomas, Quoc V. Le, and Ilya Sutskever. "Exploiting similarities ...
Gouws, Stephan, Yoshua Bengio, and Greg Corrado. "BilBOWA: fast bilingual ...
Ammar, Waleed, et al. "Massively multilingual word embeddings." arXiv preprint ...
Chidambaram, Muthu, et al. "Learning Cross-Lingual Sentence Representations via a ...
Conneau, Alexis, et al. "XNLI: Evaluating Cross-lingual Sentence Representations." Proceedings ...
Conneau, Alexis, and Guillaume Lample. "Cross-lingual language model pretraining." Advances ...
Devlin, Jacob, et al. "BERT: Pre-training of Deep Bidirectional Transformers ...
Sever, Yiğit, and Gönenç Ercan. "Evaluating cross-lingual textual similarity on ...
Wang, Liang, Wei Zhao, and Jingming Liu. "Aligning Cross-lingual Sentence ...
He, Kaiming, et al. "Momentum contrast for unsupervised visual representation ...
Briakou, Eleftheria, and Marine Carpuat. "Detecting Fine-Grained Cross-Lingual Semantic Divergences ...
Dutta, Sourav. "“Alignment is All You Need”: Analyzing Cross-Lingual Text ...
Karthikeyan, K., et al. "Cross-Lingual Ability of Multilingual BERT: An ...
Kashefi, Omid. "MIZAN: a large persian-english parallel corpus." arXiv preprint ...
Liu, Yinhan, et al. "Roberta: A robustly optimized برت pretraining ...
Reimers, Nils, and Iryna Gurevych. "Sentence-BERT: Sentence Embeddings using Siamese ...
Mueller, Jonas, and Aditya Thyagarajan. "Siamese recurrent architectures for learning ...
Singh, Archana, Avantika Yadav, and Ajay Rana. "K-means with Three ...
Cera, Daniel, et al. "Universal Sentence Encoder for English." EMNLP ...
Benesty, Jacob, et al. Noise reduction in speech processing. Vol. ...
Benesty, Jacob, et al. Noise reduction in speech processing. Vol. ...
SPEARMAN, C. " Correlation calculated from faulty data." British Journal ...

نمایش کامل مراجع