کاوش محتوا به همراه کاوش کاربردی وب برای یادگیری قوانین وابستگی مفید در وب سایتهای پربازدید

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 684

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CECCONF02_030

تاریخ نمایه سازی: 10 تیر 1396

چکیده مقاله:

با افزایش چشمگیر حجم اطلاعات و توسعه وب، نیاز به روش ها و تکنیک هایی که بتوانند امکان دستیابی موثر به داده ها و استخراج اطلاعات از آنها را فراهم کنند، بیش از پیش احساس می شود. وب کاوی یکی از زمینههای تحقیقاتی است که با استفاده از تکنیک های داده کاوی به کشف و استخراج خودکار اطلاعات از اسناد و سرویس های وب می پردازد. در واقع وب کاوی، فرآیند کشف اطلاعات و دانش ناشناخته و مفید از داده های وبمی باشد. در این مقاله به طراحی، پیاده سازی و ارزیابی الگوریتمی نوآورانه خواهیم پرداخت که به منظور استخراج اطلاعات از داده های دسترسی به وب و همچنین کاوش محتوای وب ارایه می شود. در واقع، با بکارگیری همزمانکاوش محتوای وب سایت به همراه کاوش نحوه استفاده از آن (استخراج اطلاعات از داده های دسترسی به وب)،قصد داریم به اهداف یافتن اطلاعات مفید و مرتبط، ایجاد دانش جدید و همچنین ارایه پیشنهادات بهبازدیدکنندگان و شخصی سازی اطلاعات آن وب سایت دست پیدا کنیم. شخصی سازی وب، تجربه وب را برای یک کاربر خاص یا مجموعه ای از کاربران، سازمان دهی می کند و پیشنهادات پویایی را بر اساس الگوهای رفتاری آنها ارایه می دهد. در این مقاله که پیش بینی نیازهای آتی بازدیدکنندگان در وب سایتهای پربازدید را بر اساس قوانینوابستگی یا قوانین انجمنی صورت می گیرد، در ابتدا به هر یک از صفحات وب سایت، به شکلی نوآورانه یک رتبه تخصیص داده می شود. رتبه هر صفحه از وب سایت بر اساس دو معیار مشخص می شود: (معیار اول) تعدادلینکهای موجود در سایت که به آن صفحه اشاره دارد. (معیار دوم) تعداد دفعاتی که آن صفحه توسط کاربران مشاهده می گردد. در این صورت، نتایج استخراج شده به شکل قوانین انجمنی توسط این روش جدید و همچنین پیشنهادات ارایه شده به کاربر از دقت و اهمیت بیشتری نسبت به الگوریتم های مشابه برخوردار خواهد بود .

کلیدواژه ها:

داده کاوی ، رتبه بندی صفحات وب ، کاوش محتوای وب ، کاوش استفاده از وب ، قوانین انجمنی ، شخصی سازی

نویسندگان

محمد ابراهیمی

دانشگاه آزاد اسلامی واحد جاسب

حامد آقایی

دانشگاه آزاد اسلامی واحد جاسب

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • R. Cooley, "Web Usage Mining: Discovery and Application of Interesting ...
  • E. Alpaydin, "Introduction to Machine Learning", the MIT Press, 2004. ...
  • S. S. Anand, B. Mobasher, "Intelligent Techniques for Web P ...
  • R. Baeza-Yates, B. Ribeiro-Neto, "Modern Information Retrieval", Harlow: Addison Wesley ...
  • S. Chakrabarti, "Mining the web (Discovering Knowledge from Hypertext Data)", ...
  • R. Cooley, B. Mobasher, J. Srivastava, "Grouping web page references ...
  • R. Cooley, B. Mobasher, J. Srivastava, "Web mining: Information and ...
  • R. Cooley, B. Mobasher, J. Srivastava, "Data preparation for mining ...
  • R. Cooley, .J. Srivastava, B. Mobasher, "Web mining: Information and ...
  • 1. O. Etzioni, _ World Wide Web: Quagmire or gold ...
  • U. M. Fayyad, G. P iatetsky- Shapiro, P. Smyth, R. ...
  • A. A. Freitas, "Data Mining and Knowledge Discovery with Evolutionary ...
  • J. Han, M. Kamber, "Data mining: Concepts and techniques", 2nd ...
  • H. Kato, T. Nakayama, Y. Yamane, "Navigation analysis tool based ...
  • H. Liu, V. Keselj, "Combined mining of Web server logs ...
  • B. Mobasher, H. Dai, T. Luo, Y. Sun, J. Zhu, ...
  • A. Nanopoulos, D. Katsaros, Y. Manolopoulos, "Exploiting web log mining ...
  • S. Park, N. Suresh, B. Jeong, _ S equence-based clustering ...
  • J. Pei, J. Han, B. Mortazavi-Asl, H. Pinto, Q. Chen, ...
  • D. Pierrakos, G. Paliouras, C. Papatheodorou, C. D. Spyropoulos, "Web ...
  • A. Secker, Dissertation Title: "Artificial Immune Systems for Web Content ...
  • A. Ypma, T. Heskes, _ ategorization of web pages and ...
  • نمایش کامل مراجع