رتبه بندی صفحات وب در کنار استفاده همزمان کاوش محتوای وب به همراه کاوش نحوه استفاده از آن به منظور یافتن قوانین انجمنی توسعه یافته
سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 762
فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
SENACONF02_316
تاریخ نمایه سازی: 30 آبان 1394
چکیده مقاله:
با افزایش چشمگیر حجم اطلاعات و توسعه وب، نیاز به روش ها وئ تکنیک هایی که بتوانند امکان دستیابی موثر به داده ها و استخراج اطلاعات از آنها را فراهم کنند، بیش از پیش احساس می شود. وب کاوی یکی از زمینه های تحقیقاتی است که با استفاده از تکنیک های داده کاوی به کشف و استخراج خودکار اطلاعات از اسناد و سرویس های وب می پردازد. در واقع وب کاوی، فرآیند کشف اطلاعات و دانش ناشناخته و مفید از داده های وب می باشد. در این مقاله به طراحی، پیاده سازی و ارزیابی الگوریتمی نوآورانه خواهیم پرداخت که به منظور استخراج اطلاعات از داده های دسترسی به وب و همچنین کاوش محتوی وب ارائه می شود. در واقع، با بکارگیری همزمان کاوش محتوای وب سایت دانشگاه آزاده اسلامی واحد دولت آباد (www.iauda.ac.ir) به همراه کاوس نحوه استفاده از آن (استخراج اطلاعات از داده های دسترسی به وب)، قصد داریم به اهداف یافتن اطلاعات مفید و مرتبط، ایجاد دانش جدید و همچنین ارائه پیشنهادات به بازدیدکنندگان و شخصی سازی اطلاعات آن وب سایت دست پیدا کنیم. شخصی سای وب، تجربه وب برای یک کاربر خاص یا مجموعه ای از کاربران، سازمان دهی می کند و پیشنهادات پویایی را بر اساس الگوهای رفتاری آنها ارائه می دهد. در این مقاله که پیش بینی نیازهای آتی بازدید کنندگان بر اساس قوانین انجمنی (Association Rules) صورت می گیرد، در ابتدا به هریک از صفحان وب سایت، به شکلی نوآورانه یک رتبه (Rank) تخصیص داده می شود. رتبه هر صفحه از وب سایت بر اساس دو معیار مشخص می شود: (معیار اول) تعداد لینکهای موجود درسایت که به آن صفحه اشاره دارد. (معیار دوم) تعداد دفعاتی که آن صفحه توسط کاربران مشاهده می گردد. در این صورت، نتایج استخراج شده به شکل قوانین انجمنی توسط این روش جدید و همچنین پیشنهادات ارائه شده به کاربر از دقت و اهیمت بیشتری نسببت به الگوریتم های مشابه برخوردار خواهد بود.
کلیدواژه ها:
نویسندگان
سلمان طاهری زاده
دانشگاه آزاد اسلامی واحد دولت آباد، گروه کامپیوتر، اصفهان، ایران
بابک نیک مرد
دانشگاه آزاد اسلامی واحد دولت آباد، گروه کامپیوتر، اصفهان، ایران
علا آرمان
دانشگاه آزاد اسلامی واحد دولت آباد، گروه کامپیوتر، اصفهان، ایران
بابک نداف سیچانی
دانشگاه آزاد اسلامی واحد دولت آباد، گروه کامپیوتر، اصفهان، ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :