راهکار اتوماتیک جدید برای تشخیص سرقت ادبی دو زبانه ( انگلیسی – فارسی)

مسلم محمدی جنقرا; کوثر عباس خواه

راهکار اتوماتیک جدید برای تشخیص سرقت ادبی دو زبانه ( انگلیسی – فارسی)

محل انتشار: پنجمین کنفرانس ملی محاسبات توزیعی و پردازش داده های بزرگ

سال انتشار: 1398

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 679

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > پردازش زبان طبیعی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/961934

شناسه ملی سند علمی:

DCBDP05_069

تاریخ نمایه سازی: 6 آذر 1398

چکیده مقاله:

سرقت ادبی در حوزه های دانشگاهی و مراکز تحقیقاتی یکی از دغدعه های محققان به شمار میرود. در این مقاله قصد داریم از یک روش آماری برای تشخیص برگردان از متون انگلیسی به فارسی استفاده کنیم. یک فایل به زبان فارسی به سیستم پیشنهادی ارائه میشود و سیستم باید فایل یا فایلهایی از مجموعه اسناد انگلیسی که فایل مورد نظر از روی آنها نوشته شده است، را پیدا کرده و نمایش دهد. از آنجائیکه ذات مسئله تشخیص سرقت و بررسی میزان مشابهت، یک مسئله زمان بر است، سعی میشود تعداد فایلهایی که مورد بررسی قرار میگیرد تا حد ممکن کاهش یابد. برای این منظور از اصل عدم تغییر موضوع در سرقت ادبی استفاده کرده و اسناد را در گروه ها وموضوعات مختلف ردهبندی میکنیم و هر فایلی که به سیستم ارائه میشود، ابتدا با استفاده از یک رده بند موضوع آن مشخص شده و تنها با فایلهای انگلیسی که موضوع مشابه دارند، مورد مقایسه قرار میگیرد. برای مقایسه و بررسی میزان مشابهت ابتدا موقعیتهای هر کلمه سند فارسی در فایل انگلیسی با استفاده از یک دیکشنری به صورت یک بردار مشخص میشود و سپس با استفاده از یک روش محاسبه فاصله رخداد کلمات مجاور در سند فارسی و انگلیسی، میزان مشابهت سنجیده میشود.

کلیدواژه ها:

سرقت ادبی ، رده بندی اسناد ، مشابهت سنجی اسناد ، پردازش زبان طبیعی ، پردازش دو زبانه

نویسندگان

مسلم محمدی جنقرا

استادیار، گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه پیام نور، تهران،

کوثر عباس خواه

گروه علوم تربیتی، دانشگاه پیام نور، تهران،