پیمایش موضوعی وب با استفاده از اتوماتای یادگیر توزیع شده و پارتیشن بندی گراف
محل انتشار: یازدهمین کنفرانس سراسری سیستم های هوشمند
سال انتشار: 1391
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,048
فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICS11_167
تاریخ نمایه سازی: 14 مهر 1392
چکیده مقاله:
پیمایش وب جهت یافتنی صفحاتی که توسط موتور جستجو شاخص گذاری شوند، از اهمیت بالایی برخوردار است. از آن جا که حجم صفحات وب بسیار بالا و همواره رو به افزایش است، موتورهای جستجو قادر به شاخص گذاری صفحات محدودی هستند. پیمایشگرهای موضوعی با پیمایشگرهای متمرکز، در روند پیمایش خود به صورت انتخاب گر عمل می کنند و صفحاتی را برای پیمایش انتخاب می کنند که تا حد ممکن در ارتباط با موضوعی خاص باشند. در این مقاله روشی ترکیبی مبتنی بر اتوماتای یادگیر توزیع شده و پارتیشن بندی گراف برای پیمایش موضوعی صفحات وب پیشنهاد می گردد. روش پیشنهادی با استفاده از الگوریتم HITSو ساختار پیوند بین صفحات که از طریق رفتار کاربر در مشاهده این صفحات به دست آمده است، صفحاتی را برای پیمایش انتخاب می کند. در این مقاله از پارتیشن بندی گراف وب برای بهبود کارایی استفاده شده است. به منظور ارزیابی، نتایج روش پیشنهادی با نتایج الگوریتم عرض اول، Best Firstو الگوریتمی دیگری مبتنی بر اتوماتای یادگیر توزیع شده مقایسه شده است. نتایج آزمایش ها حاکی از کارایی روش پیشنهادی دارد
کلیدواژه ها:
پیمایش موضوعی وب ، اتوماتای یادگیر توزیع شده ، پارتیشن بندی گراف ، داده های استفاده از وب ، الگوریتم HITS
نویسندگان
مجید تاران
شرکت خدمات انفورماتیک، تهران، ابران
شهرزاد معتمدی مهر
دانشکده فنی و مهندسی، دانشگاه خوارزمی، تهران، ایران
علی برادران هاشمی
دانشکده مهندسی کامپیوتر و فناوری اطلاعات،دانشگاه صنعتی امیرکبیر، تهران، ایران
محمد رضا میبدی
دانشکده مهندسی کامپیوتر و فناوری اطلاعات،دانشگاه صنعتی امیرکبیر، تهران، ایران