راهکار اتوماتیک جدید برای تشخیص سرقت ادبی دو زبانه ( انگلیسی – فارسی)

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 583

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

DCBDP05_069

تاریخ نمایه سازی: 6 آذر 1398

چکیده مقاله:

سرقت ادبی در حوزه های دانشگاهی و مراکز تحقیقاتی یکی از دغدعه های محققان به شمار میرود. در این مقاله قصد داریم از یک روش آماری برای تشخیص برگردان از متون انگلیسی به فارسی استفاده کنیم. یک فایل به زبان فارسی به سیستم پیشنهادی ارائه میشود و سیستم باید فایل یا فایلهایی از مجموعه اسناد انگلیسی که فایل مورد نظر از روی آنها نوشته شده است، را پیدا کرده و نمایش دهد. از آنجائیکه ذات مسئله تشخیص سرقت و بررسی میزان مشابهت، یک مسئله زمان بر است، سعی میشود تعداد فایلهایی که مورد بررسی قرار میگیرد تا حد ممکن کاهش یابد. برای این منظور از اصل عدم تغییر موضوع در سرقت ادبی استفاده کرده و اسناد را در گروه ها وموضوعات مختلف ردهبندی میکنیم و هر فایلی که به سیستم ارائه میشود، ابتدا با استفاده از یک رده بند موضوع آن مشخص شده و تنها با فایلهای انگلیسی که موضوع مشابه دارند، مورد مقایسه قرار میگیرد. برای مقایسه و بررسی میزان مشابهت ابتدا موقعیتهای هر کلمه سند فارسی در فایل انگلیسی با استفاده از یک دیکشنری به صورت یک بردار مشخص میشود و سپس با استفاده از یک روش محاسبه فاصله رخداد کلمات مجاور در سند فارسی و انگلیسی، میزان مشابهت سنجیده میشود.

نویسندگان

مسلم محمدی جنقرا

استادیار، گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه پیام نور، تهران،

کوثر عباس خواه

گروه علوم تربیتی، دانشگاه پیام نور، تهران،