بهبود طبقه بندی قطعات فایل با انتخاب ویژگی به روش ترکیبی فیلتر و جایگشت

سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 362

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

DTIS01_012

تاریخ نمایه سازی: 3 بهمن 1400

چکیده مقاله:

شناسایی نوع فایل های قطعه بندی شده یک کار بسیار مهم در آنالیز Forensic محسوب می شود که می توان با چندین روش آن راانجام داد. یکی از روش های متداول برای تعیین ویژگی فایل ها؛ استخراج قسمتی از فایل بعنوان ورودی برای استفاده از الگوریتم هایطبقه بندی است. گرچه این روش مشکل بزرگ داده ها را در پی دارد و تعدد ویژگی های استخراج شده بسیار زیاد است. این مشکلسبب میشود یادگیری و طبقه بندی، نادرست و ناکارآمد باشد . در این مقاله یک روش ترکیبی برای حل این مسئله با استفاده از فیلتربندی و (wrappers( پیشنهاد می شود تا تعداد ویژگی های موجود را بطور قابل توجهی کاهش داده و همچنین دقت طبقه بندی فایلها نیز بهبود یابد. در مرحله اول از ۳ فیلتر مناسب جهت فیلتر کردن تعدادی زیادی از ویژگی های موجود بی ربط و یا کم اهمیتاستفاده میشود، سپس آن ها را ترکیب می کند و سپس برخی (wrappers) به جهت کاهش تعداد ویژگی های اضافی و انتخاب ویژگیهای برجسته از بین آن ها استفاده می شود. در این مقاله، از دیتاست GOV-DOCS (یک پایگاه داده نشریه ای از سراسر ایالاتمتحده) استفاده شده است. نتایج آزمایش های انجام شده نشان می دهد که روش ما توانسته است تعداد ویژگی ها را از ۶۶۳۱۳ به ۱۱ الی۳۲ کاهش دهد؛ همچنین در مقایسه با سایر روش هایی که از همه ویژگی های موجود استفاده می کند؛ این روش دقت طبقه بندی رانیز بهبود می بخشد.

کلیدواژه ها:

نویسندگان

رویا زارع فرخادی

عضو هیئت علمی گروه کامپیوتر موسسه آموزش عالی و غیرانتفاعی رشدیه، تبریز