تشخیص سرقت علمی اسناد فارسی با رویکرد مبتنی بر گراف
- سال انتشار: 1395
- محل انتشار: هشتمین کنفرانس بین المللی فناوری اطلاعات ودانش
- کد COI اختصاصی: ICIKT08_155
- زبان مقاله: فارسی
- تعداد مشاهده: 1117
نویسندگان
دانشجوی کارشناسی ارشد دانشگاه تهران
استادیار، عضو هیئت علمی دانشگاه تهران
استادیار، عضو هیئت علمی دانشگاه تهران
چکیده
در این مقاله روشی نوین برای تشخیص سرقت علمی در اسناد فارسی ارائه شده است. این روش از ساختار گراف و یکی از روشهای تشابه گراف(روش تکرار در مشابهت گره ها) برای یافتن تشابه در دو سند متنی به زبان فارسی استفاده می کند. در این روش ابتدا دوتایی های سند مشکوک بهسرقت علمی را بدست می آوریم و با دوتایی های اسناد ذخیره شده در پایگاه داده مقایسه می کنیم، اگر تعداد دوتایی های مشترک در دو سند از حدآستانه مشخص بیشتر باشد این دو سند برای تشخیص وجود یا عدم وجود سرقت علمی به عنوان ورودی تابع تشخیص سرقت علمی انتخاب می شوند.در این تابع ابتدا سندها به گراف هایی دارای ساختار منظم تبدیل می شوند، سپس به کمک روش تشابه وجود همسایگان مشترک در دو گراف، وجودسرقت علمی یا عدم وجود سرقت علمی، به عنوان خروجی این تابع حاصل می شود. پس از اجرای روش پیشنهادی روی دو مجموعه داده، معیار F ،این روش نسبت به روش مبتنی بر n -گرام نرم افزار مشابه یاب سمیم نور، 20 درصد روی مجموعه داده اول (سرقت علمی از نوع معنایی) و 13 درصدروی مجموعه داده اول (شامل انواع سرقت علمی)، بهبود یافته است. همچنین توانایی این روش برای مقابله با داده نویز بیشتر می باشد.کلیدواژه ها
سرقت علمی، گراف، تشابه یابی، متن فارسیمقالات مرتبط جدید
- مسیریابی مبتنی بر یادگیری تقویتی با تابع پاداش ترکیبی در شبکه های کم مصرف و ناپایدار اینترنت اشیاء (LLNS)
- تشخیص حمله کپی کت در شبکه های اینترنت اشیاء مبتنی بر RPL با استفاده از طبقه بندی درخت تصمیم
- مروری بر روشهای مدیریت دسترسی انبوه در اینترنت اشیاء مبتنی بر شبکه های سلولی از چالش ها تا راهکارهای هوشمند
- بهبود مصرف انرژی و تاخیر مسیریابی در اینترنت اشیاء با استفاده از توسعه پروتکل مسیریابی شبکه های کم توان و پراتلاف
- بهینه سازی جایگذاری ماشین مجازی در زیرساخت های اینترنت اشیا-ابر از طریق الگوریتم کپک مخاطی الهام گرفته از کوانتوم
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.