ارائه ی روشی جدید برای خزنده های داده های پیوندی در دی بی پدیا

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 790

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CBCONF01_0370

تاریخ نمایه سازی: 16 شهریور 1395

چکیده مقاله:

موتورهای جستجوگر برای جمع آوری محتویات صفحات وب از خزنده ها استفاده می کنند. خزنده های معمولی بدلیلرشد روز افزون داده ها و اطلاعات در وب قادر به پوشش ک صفحات نیستند. بنابراین با توجه به محدودیت منابع و زمانمی بایست از خزنده های متمرکز برای بازیابی صفحات دارای اهمیت بیشتر استفاده کرد. در وب کنونی اسناد توسط ابرمتن ها به یکدیگر لینک می شوند که بدون نوع و صرفا توسط انسان قابل تشخیص و دارای ساختار بسیار ضعیف میباشند و استخراج داده از این صفحات و کسب دانش بصورت خودکار توسط ماشین انجام پذیر نمی باشد. از چالش های پیشروی وب کنونی می توان سادگی نمایش داده های بدون ساختار و لینک های بدون نوع، عدم یکپارچگی پایگاه دادهای مختلفو نیاز اطلاعاتی کاربران به چندین پایگاه داده و همچنین پرس و جو در وب بر اساس مجموعه ای از کلید واژه ها را نام برد.در این مقاله خزش بجای اینکه بروی صفحات وب ساده انجام شود داده های پیوندی را بررسی می نماید. برای مثال دی بیپدیا که محلی از داده در دسترس برای کاربران کامپتوتر است را می توان در نظر گرفت که شامل مجموعه ای از داده هایوب در خصوص مطالب مختلف بر اساس ساختار RDF و تکنولوژی داده های پیوندی است. هدف از این مقاله پیاده سازیخزنده برای داده های پیوندی و ارزیابی روش پیشنهادی بر روی مجموعه داده دی بی پدیا است. در نتیجه محصول ماطراحی یک خزنده متمرکز مخصوص داده های پیوندی با سرعت خزش بسیار بالا می باشد.

کلیدواژه ها:

نویسندگان

حمید رستگاری

دانشکده مهندسی کامپیوتر ، واحد نجف آباد، دانشگاه آزاد اسلامی ،نجف آباد، ایران

روح الله سعیدی

کارشناس ارشد نرم افزار کامپیوتر واحد علوم و تحقیقات تهران

هادی خسروی فارسانی

عضو هیئت علمی دانشگاه شهرکرد

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Campbell G. 2011. RDA and rd: a discourse analysis of ...
  • Khosravi H 2010 Entity ranking in web of data. The ...
  • Heath, T.; An Introduction to Linked Data, Slides, Austin, Texas, ...
  • Gerber A, Barnard A, Joanna A. 2007. Towards a semantic ...
  • S. Chakrabarti, M.V.D. Berg, B.Dom, "Focused crawling: a new approach ...
  • Am sterdam , Netherlands , pp. 1623- 1640, 1999 ...
  • B. Pinkerton, "Finding what people want: experiences with the web ...
  • A. Rungsawang, N. Angkaw attanawit, "Learnable topic-specific web crawler, " ...
  • Salton, G.(1991) Developments in Automatic Text Retrieval, Science, 253 , ...
  • نمایش کامل مراجع