تشخیص سرقت علمی اسناد فارسی با رویکرد مبتنی بر گراف

مژگان ممتاز; مصطفی صالحی; هادی ویسی

تشخیص سرقت علمی اسناد فارسی با رویکرد مبتنی بر گراف

محل انتشار: هشتمین کنفرانس بین المللی فناوری اطلاعات ودانش

سال انتشار: 1395

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,032

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/548814

شناسه ملی سند علمی:

ICIKT08_155

تاریخ نمایه سازی: 5 بهمن 1395

چکیده مقاله:

در این مقاله روشی نوین برای تشخیص سرقت علمی در اسناد فارسی ارائه شده است. این روش از ساختار گراف و یکی از روشهای تشابه گراف(روش تکرار در مشابهت گره ها) برای یافتن تشابه در دو سند متنی به زبان فارسی استفاده می کند. در این روش ابتدا دوتایی های سند مشکوک بهسرقت علمی را بدست می آوریم و با دوتایی های اسناد ذخیره شده در پایگاه داده مقایسه می کنیم، اگر تعداد دوتایی های مشترک در دو سند از حدآستانه مشخص بیشتر باشد این دو سند برای تشخیص وجود یا عدم وجود سرقت علمی به عنوان ورودی تابع تشخیص سرقت علمی انتخاب می شوند.در این تابع ابتدا سندها به گراف هایی دارای ساختار منظم تبدیل می شوند، سپس به کمک روش تشابه وجود همسایگان مشترک در دو گراف، وجودسرقت علمی یا عدم وجود سرقت علمی، به عنوان خروجی این تابع حاصل می شود. پس از اجرای روش پیشنهادی روی دو مجموعه داده، معیار F ،این روش نسبت به روش مبتنی بر n -گرام نرم افزار مشابه یاب سمیم نور، 20 درصد روی مجموعه داده اول (سرقت علمی از نوع معنایی) و 13 درصدروی مجموعه داده اول (شامل انواع سرقت علمی)، بهبود یافته است. همچنین توانایی این روش برای مقابله با داده نویز بیشتر می باشد.

کلیدواژه ها:

سرقت علمی ، گراف ، تشابه یابی ، متن فارسی

نویسندگان

مژگان ممتاز

دانشجوی کارشناسی ارشد دانشگاه تهران

مصطفی صالحی

استادیار، عضو هیئت علمی دانشگاه تهران

هادی ویسی

استادیار، عضو هیئت علمی دانشگاه تهران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

طاهری، زهرا و همکاران"تشخیص تقلب متون با استفاده از درخت ...
طاهری، زهرا و همکاران" تشخیص تقلب متون با استفاده از ...
Zu Eissen, Sven Meyer, and Benno Stein, "Intrinsic plagiarism detection."., ...
Oberreuter, Gabriel, and Juan D. VelaSquez, Text mining applied to ...
N.Kumar, A graph based automatic plagiarism detection technique to handle ...
Zini, Manuel, Fabbri, Marco, Moneglia, Massimo, and Pamunzi, Alessndro, Plagiarism ...
Nahnsen, Thade, Uzuner, Ozlem, and Katz, Boris, Lexical chains and ...
Hoad, Timothy C and Zobel, Justin, "Methods for identifying versioned ...
". P. t. P. D. , - C. R. Z. ...
Leilei, K., Haoliang, Q., Shuai, W., Cuixia, D., Suhong, W., ...
M. Zini, "Plagiarism Detection through Multilevel Text Comparison, " in ...
. a. A. Si, ""CHECK: a document plagiarism detection system, ...
M. Elhadi and A Al-Tobi, "Use of text syntactical structures ...
M. Elhadi and A. Al-Tobi, "Duplicate Detection in Documents and ...
. a. C. Leacock, "Using corpus statistics and WordNt relations ...
S. T. a. A. Gelbukh, "Comparing Similarity Measures for Original ...
P. Resnik, "Semantic similarity in a taxonomy: An information-b ased ...
Sonawane, S. S., & Kulkarni, P. A, "Graph based Representation ...
"http ://www.sobhe ir/hazm, " [Online]. ...
K. e. a. Kho shnavataher, "Developing Monolingual Persian Corpus for ...

نمایش کامل مراجع