Design and Implementation of a Language Specific Crawler to Improve Crawling of Persian Web Documents

  • سال انتشار: 1388
  • محل انتشار: مجله بین المللی ارتباطات و فناوری اطلاعات، دوره: 1، شماره: 4
  • کد COI اختصاصی: JR_ITRC-1-4_002
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 248
دانلود فایل این مقاله

نویسندگان

Masomeh Azimzadeh

Iran Telecommunications Research Center(ITRC) Tehran, Iran

Alireza Yari

Iran Telecommunications Research Center(ITRC) Tehran, Iran

Abolfazl Aleahmad

Database Research Department of Tehran University,Tehran,Iran

چکیده

کلیدواژه ها

Persian Crawl, Focused crawl, language crwal, informtion recovery

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.