شناسایی موثر هرزنامه ها در شبکه اجتماعی توئیتر با استفاده از رتبه بندی ویژگیها

  • سال انتشار: 1400
  • محل انتشار: چهاردهمین کنفرانس ملی علوم و مهندسی کامپیوتر و فناوری اطلاعات
  • کد COI اختصاصی: CECCONF14_035
  • زبان مقاله: فارسی
  • تعداد مشاهده: 518
دانلود فایل این مقاله

نویسندگان

زهرا بهادری

دانشجوی کارشناسی ارشد دانشگاه شیراز، شیراز، ایران

فرنوش معنوی

دانشجوی دکتری دانشگاه شیراز، شیراز، ایران

علی حمزه

استاد دانشکده مهندسی برق و کامپیوتر، دانشگاه شیراز، شیراز، ایران

چکیده

شبکه های اجتماعی همانند فیسبوک، توئیتر ارتباطات و دسترسی به اخبار را در زندگی روزانه افراد در سال های اخیر دگرگون ساخته اند. حجم وسیعی از داده در این شبکه ها توسط کاربران تولید میگردد. رشد سریع هرزنامه ها در اینترنت و شبکه های اجتماعی اعتبار تحقیقاتی که بر پایه داده های بدست آمده از آنها انجام شده است، را به خطر می اندازد. بنابراین این امر محققان را در سالهای اخیر بر آن ساخته که با استفاده از روشهای متعدد مبتنی بر یادگیری ماشین در پی دستیابی به روشی جدید و با دقت بالا در شناسایی هرزنامه ها باشند. این تحقیق روشی سریع و موثر در شناسایی هرزنامه در توئیتر را ارائه میدهد. در روش پیشنهادی پس از جمع آوری داده و انجام مراحل پیش پردازش و استخراج مجموعه ویژگی مناسب، مدلسازی صورت گرفته است و با استفاده از روش های مختلف انتخاب ویژگی، ۱۰ ویژگی موثر انتخاب گردیده است که سبب می شود از پیچیدگی محاسباتی کاسته شود و در زمان استخراج ویژگی و یادگیری صرفه جویی کند و در نهایت بر اساس طبقه بند XGBoost مدلی با دقت ۹۹.۸۴ برای شناسایی هززنامه ها به ارمغان میآورد. جهت ارزیابی مدل از روش اعتبارسنجی متقابل استفاده شده است.

کلیدواژه ها

انتخاب ویژگی، پردازش متن، شبکه های اجتماعی، شناسایی هرزنامه، یادگیری ماشین

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.