افزایش کیفیت الگوریتم رتبه بندی صفحات وب با استفاده از روش دسته بندی
- سال انتشار: 1390
- محل انتشار: سومین کنفرانس مهندسی برق و الکترونیک ایران
- کد COI اختصاصی: ICEEE03_101
- زبان مقاله: فارسی
- تعداد مشاهده: 1316
نویسندگان
واحد تحقیقات شرکت داده کاوان ایسانا مشهد
چکیده
تاکنون الگوریتم ها و روشهای متعددی در جهت رتبه بندی صفحات وب ارائه شده است برخی از این روشها براساس تحلیل لینک و برخی دیگر براساس تحلیل محتوی کار می کنند هدف این مقاله ارائه روشی به منظور افزایش کیفیت رتبه بندی صفحات است که مبتنی بر ترکیب روشهای تحلیل لینک و محتوی می باشد با توجه به این متد ابتدا صفحات وب براساس خصوصیات آنها به دسته های گوناگون تقسیم می شوند و درصد نزدیکی یک صفحه با تمامی دسته ها بررسی می شود سپس محبوبیت آن صفحه را در بین کل صفحات گراف وب که با آن تشابه معنایی دارند بدست می آوریم برای این کار تغییراتی را در ساختار الگوریتم PageRank استاندارد اعمال کردیم تا تاثیر لینکهای وارد شونده به صفحه فقط از صفحات متشابه به آن در نظر گرفته شود در نهایت با ادغام درصد شباهت صفحه در دست ههایی که به آن تعلق دارد و رتبه محبوبیت آن در بین کل صفحات متشابه رتبه صفحه مذکور در هر دسته بصورت مجزا بدست می آید.کلیدواژه ها
تحلیل لینک، تحلیل محتوی، دسته بندی ،Content PageRank(CPR)،AvgTF-IDFمقالات مرتبط جدید
- سیستم تشخیص نفوذ در محیط رایانش ابری با استفاده از یادگیری ویژ گی
- کاهش هزینه تعمیراتی ماشین های سنگین از طریق بهبود الگوریتم درخت تصمیم با الگوریتم های انتخاب ویژگی Information Gain ،Correlation و SVM
- پردازش کوانتومی تصاویر پزشکی و تشخیص لبه آن با استفاده از الگوریتم QHED
- بررسی و مقایسه روشهای تشخیص اکانت های جعلی در شبکه های اجتماعی
- مکان یابی و مقدار بهینه منابع تولید پراکنده به منظورکاهش تلفات و بهبود انحراف ولتاژ شبکه نامتعادل توزیع
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.