دسته بندی خودکار صفحات وب با استفاده از روش های دسته بندی کننده ی ترکیبی

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 685

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CEIT01_460

تاریخ نمایه سازی: 9 تیر 1393

چکیده مقاله:

در سال های اخیر همگانی شدن اینترنت و شبکه های کامپیوتری باعث تولید روزانه ی حجم بسیار وسیعی از اطلاعات و صفحات تحت وب گردیده است. در این راستا یکی از کاربردهای مهم و اجتناب ناپذیر جهت پردازش این اطلاعات، فرآیند دسته بندی دقیق و بهینه ی این صفحات می باشد. دسته بندی صفحات وب عبارت است از انتساب یک صفحه وب به یک یا بیشتر از یک گروه عنوان از پیش تعیین شده. در این مقاله ابتدا عملیات انتخاب ویژگی و سپس استخراج ویژگی صورت گرفته است. در نتیجه ضمن حذف نویز ابعاد مجموعه داده تا حد ممکن کاهش یافته است. در این کار بااستفاده از داده های موجود در متن، ساختار و آدرس صفحات وب مجموعه داده ای کامل ایجاد شده است و از روش های ترکیب دسته بندی کننده ها به منظور ایجاد یک سیستم خودکار دسته بندی کننده صفحات وب استفاده شده است. در این کار از مجموعه داده Open Directory Progect(ODP) استفاده شده است . نتایج آزمایشات انجام شده نشان دهنده کارایی بیشتر سیستم پیشنهادی نسبت به سیستم های مشابه است .

کلیدواژه ها:

دسته بندی صفحات وب ، بگینگ ، بوستینگ ، استکینگ ، آدابوست

نویسندگان

علی نبیان خوزانی

دانشجوی کارشناسی ارشد گروه مهندسی کامپیوتر، دانشگاه شهید چمران اهواز، اهواز، ایران

علی رضا عصاره

دانشیار، گروه مهندسی کامپیوتر، دانشگاه شهیدچمران اهواز، اهواز، ایران

بیتا شادگار

استادیار، گروه مهندسی کامپیوتر، دانشگاه شهید چمران اهواز، اهواز، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Alpaydin, E. (2004). Introduction to Machine Learning. MIT Press, Cambridge. ...
  • Biricik, G., Diri, B. (2009) Impact of a New Attribute ...
  • Chakrabarti, S. et al (1998). Enhanced Hypertext Categorization using Hyperlinks. ...
  • Chen, C., Lee, H., Tan, C. (2006). An intelligent web-page ...
  • Fiol-Roig, G. et al (2011). Data Mining ...
  • Hernandez, I. et al (2012). An Experiment to Test URL ...
  • Klassen, M., Paturi, N. (2010). Web Document Classification by Keywords ...
  • Liu, W. et al (2005). Importance-B ased Web Page Classification ...
  • Rajalakshmi, R., Aravindan, C. (2011). Naive Bayes Approach for Website ...
  • Selamat, A., Omatu, S. (2004). Web page feature selection and ...
  • Feature Selection " wrapper ...
  • نمایش کامل مراجع