سیستم هوشمند فیلتر کردن هرزنامه ها با استفاده از ترکیب الگوریتم هایSMO و SVM
سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 702
فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
IAUFASA02_027
تاریخ نمایه سازی: 17 اسفند 1393
چکیده مقاله:
افزایش کاربران ایمیل منجر به افزایش چشمگیرهرزنامه هادرطی سالهای اخیر شده است تولید کنندگان هرزنامه همواره تلاش می کنند که راهکارهای جدیدتری به منظور گریز ازفیلترهای موجود بیابند بنابراین ضرورت دارد که فیلترهای جدیدی متناسب با این هرزنامه ها توسعه یابد عموما مهمترین ابزار به منظور فیلتر کردن هرزنامه ها براساس طبقه بندی متون کار می کنند مهمترین روشهای طبقه بندی ازتکنیکهای یادگیری ماشین استفاده می کنند تاکنون روش های زیادی به منظور مقابله باهرزنامه پیشنهاد شده است اما باتوجه به بکارگیری مستمر تکنیکهای جدید توسط تولید کنندگان هرزنامه ها نیاز بیش ازپیش به استفاده ازتکنیکهای جدید و هوشمند مقابله با این هرزنامه ها احساس میشود درحال حاضر استفاده ازالگوریتم های یادگیری ماشین یکی ازموثرترین ومحبوب ترین روشهادرفیلترکردن خودکارهرزنامه ها می باشددراین مقاله مدل جدیدی برای فیلترکردن خودکار هرزنامه ها براساس روشهای ترکیبی یادگیری ماشین ازجمله الگوریتم Ensemble ارایه شدها ست برای پیاده سازی ازنرم افزار RapidMinerاستفاده شدها ست این مدل شامل دوفاز پیش پردازش مجموعه داده و فاز دسته بندی ایمیل ها می باشد فاز پیش پردازششامل مراحل اماده ساز یمجموعه داده شاخص گذاری و وزندهی شاخصها می باشد مرحله اماده سازی شامل بخشهای یک شکل سازی متن تقسیم متن به واحدهای با معنی مثل کلمه حذف کلمات متوقف کننده و علائم نگارشی می باشد مادرمدل پیشنهادی برای شاخص گذاری درفاز پیش پردازش ازروش N-gramوبرای وزن دهی به شاخصها ازفیلتر TF.IDF استفاده کرده ایم
کلیدواژه ها:
نویسندگان
فاطمه حیدری
کارشناسی ارشدنرم افزارجهاد دانشگاهی خوزستان اهواز ایران
علیرضا عصاره
دانشیارگروه کامپیوتر دانشگاه شهیدچمران اهواز ایران
بیتا شادگار
استادیارگروه کامپیوتر دانشگاه شهیدچمران اهواز ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :