ارائه روشی برای تشخیص بهتر ایمیل های اسپم از غیر اسپم با استفاده از داده کاوی
- سال انتشار: 1394
- محل انتشار: دومین همایش پژوهش های نوین در علوم و فناوری
- کد COI اختصاصی: EMAA02_077
- زبان مقاله: فارسی
- تعداد مشاهده: 2067
نویسندگان
چکیده
کم ارزش ترین و مهمترین ارتباطات درجهان امروز ایمیل است کلمه اسپم استفاده شده تاناخواسته بودن میلهای بی ارزش فرستاده شده به اینباکس یککاربر اینترنترا توضیح دهد تکنولوژی مختلفی درسروکارباایمیل اسپم ناخواسته پیشنهاد شده اند ت حقیق روی الگوریتم انتخابی منفی اساسا روی کشف ناهنجاری و کشف خرابی متمرکز استدراین مقاله بابهره گیری ازدانش داده کاوی توانستیم خوشه بندی بهتر با خطای کمتری را نتیجه بگیریم شبکه عصبی مربوط به دیتاست ایمیل را ساخته واموزش دادیم و میزان خطای میانگین مربعات آن را محاسبه کردیم سپس دیتاست ایمیل را درسه مرحله به بخشهای اموزش و تست تقسیم کرده و درهرمرحله میزان خطای میانگین مربعات را محاسبه کردیم برروی مجموع داده هایی که دراین مرحله اسپم شناخته شدند نیز الگوریتم خوشه بندی فازی را اعمال کردیم و شبکه عصبی مربوط به آن را ساختیم و میزان خطای میانگین مربعات این قسمت را نیز محاسبه کردیم و درنهایت با مقایسه خطای به دست آمده ازدیتاست اولیه و مجموع سه مرحله ای که cross validation انجام دادیمدر20تکرار این نتیجه بدست می اید که استفاده ازcross validation روی دیتاست اولیه خطای میانگین مربعات را کاهش داده و بااستفاده ازاین تکنیک میتوانیم تشخیص بهتری را برای مجزا کردن ایمیل های اسپم ازغیراسپم داشته باشیمکلیدواژه ها
شبکه عصبی ، خطای میانگین مربعات ، الگوریتم خوشه بندی فازیاطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.