ارایه یک روش نوین جهت پیش بینی مولفه های آسیب پذیر نرم افزار با استفاده از تشابه ویژگی ها توسط تطابق زیر دنباله ی توکن ها و آزمون فرض

  • سال انتشار: 1396
  • محل انتشار: دومین کنفرانس بین المللی پژوهش های دانش بنیان در مهندسی کامپیوتر و فناوری اطلاعات
  • کد COI اختصاصی: CITCOMP02_056
  • زبان مقاله: فارسی
  • تعداد مشاهده: 474
دانلود فایل این مقاله

نویسندگان

سیدمهدی حسن پور

گروه امنیت اطلاعات، دانشکده ICT، دانشگاه صنعتی مالک اشتر، تهران، ایران

رضا عزمی

دانشیار گروه مهندسی کامپیوتر، دانشگاه الزهرا(س)، تهران، ایران

محمدرضا ولوی

دانشیار گروه مخابرات-امنیت اطلاعات، دانشگاه صنعتی مالک اشتر، تهران، ایران

چکیده

مشخصه اصلی مدل های پیش بینی مبتنی بر تحلیل کد که از روش های متن کاوی و یادگیری ماشین بهره می برند، آن است که ویژگی ها از پیش تعیین شده و ثابت نیستند و با توجه به مجموعه داده ها که شامل کد برنامه های مشخصی هست تعیین شده و بنابراین هر برنامه مدل اختصاصی خود را دارد که الزاما برای کاربردهای مشابه قابل استفاده نیست. یکی از مشکلات فعلی عدم امکان شخصی سازی یا اعمال سیاست های مختلف در زمان ایجاد مجموعه دادگان است. این مسیله نیز مورد بحث و بررسی قرار گرفت و روشی جهت برطرف سازی این مساله ارایه شد. در این پژوهش رویکردی نوین و ترکیبی مبتنی بر یافتن ویژگی های مشابه با استفاده از تطابق دنباله ها در تکنیک بردار فرکانس کلمات جهت تولید مجموعه دادگان ویژه و آزمون فرض آماری برای کاهش حجم ویژگی های با قطعیت آماری پایین برای افزایش دقت پیش-بینی بکار گرفته شده است. ارزیابی روش بر روی مجموعه ای از کد برنامه های معروف جاوای اندروید که شامل بیش از 100هزار خط کد برنامه که در پژوهش های مشابه استفاده شده، انجام پذیرفته است. نتایج حاصل بهبود 20% میانگین را در آزمایش های میان پروژه ای در افزایش دقت پیش بینی مولفه های آسیب پذیر نشان می دهد

کلیدواژه ها

انتخاب ویژگی، گسسته سازی، کاهش بعد، مدل های پیش بینی آسیب پذیری، آزمون فرض

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.