افزایش کیفیت الگوریتم رتبه بندی صفحات وب با استفاده از روش دسته بندی

  • سال انتشار: 1390
  • محل انتشار: سومین کنفرانس مهندسی برق و الکترونیک ایران
  • کد COI اختصاصی: ICEEE03_101
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1316
دانلود فایل این مقاله

نویسندگان

امیدرضا نظیفی

واحد تحقیقات شرکت داده کاوان ایسانا مشهد

نویدرضا نظیفی

چکیده

تاکنون الگوریتم ها و روشهای متعددی در جهت رتبه بندی صفحات وب ارائه شده است برخی از این روشها براساس تحلیل لینک و برخی دیگر براساس تحلیل محتوی کار می کنند هدف این مقاله ارائه روشی به منظور افزایش کیفیت رتبه بندی صفحات است که مبتنی بر ترکیب روشهای تحلیل لینک و محتوی می باشد با توجه به این متد ابتدا صفحات وب براساس خصوصیات آنها به دسته های گوناگون تقسیم می شوند و درصد نزدیکی یک صفحه با تمامی دسته ها بررسی می شود سپس محبوبیت آن صفحه را در بین کل صفحات گراف وب که با آن تشابه معنایی دارند بدست می آوریم برای این کار تغییراتی را در ساختار الگوریتم PageRank استاندارد اعمال کردیم تا تاثیر لینکهای وارد شونده به صفحه فقط از صفحات متشابه به آن در نظر گرفته شود در نهایت با ادغام درصد شباهت صفحه در دست ههایی که به آن تعلق دارد و رتبه محبوبیت آن در بین کل صفحات متشابه رتبه صفحه مذکور در هر دسته بصورت مجزا بدست می آید.

کلیدواژه ها

تحلیل لینک، تحلیل محتوی، دسته بندی ،Content PageRank(CPR)،AvgTF-IDF

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.