غنی سازی پایگاه داده با استخراج دانش از وب مبتنی بر کاربست راهکارهای داده کاوی و وب معنایی

سال انتشار: 1397
محل انتشار: سومین کنفرانس ملی در مهندسی کامپیوتر، فناوری اطلاعات و پردازش داده ها
کد COI اختصاصی: CITCOMP03_008
زبان مقاله: فارسی
تعداد مشاهده: 739

دانلود فایل این مقاله

نویسندگان

مطهره پورملایی فومنی

دانشجوی کارشناسی ارشد، گروه مهندسی کامپیوتر و فناوری اطلاعات ، موسسه آموزش عالی دیلمان، لاهیجان، ایران

فاطمه احمدی آبکناری

استادیار، گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه پیام نور رشت، ایران

محبوبه یعقوبی

مربی، گروه مهندسی کامپیوتر و فناوری اطلاعات، موسسه آموزش عالی دیلمان، لاهیجان

چکیده

کشف دانش و دسترسی سریع به اطلاعات مورد نیاز در شبکه گسترده جهانی از اهمیت زیادی برخوردار است. در ده ههای گذشته بسیاری از روشهای پیشنهادی، ترکیب روش داده های کشف دانش با داده های وب معنایی بودند. وب معنایی تکاملی از وب است که فراتر از قابلیتهای کنونی وب، اطلاعات قابل خواندن و قابل فهم برای ماشین را فراهم ساخته است. داده های باز پیوندی یک مجموعه باز و به هم پیوسته از مجموعه داده هایی هستند که به فرم ماشینی تفسیر شده اند و به عنوان مثال حوزه های مختلف علوم زیستی را در اطلاعات دولتی پوشش میدهند. در پژوهش های صورت گرفته در این حوزه از داده های باز پیوندی برای ایجاد یک رویکرد برای انتزاع معنایی برای تعمیم طبقه بندی توییت استفاده شده است و یا برای ایجاد یک روش یادگیری ماشین برای پیش بینی آتش سوزی جنگل با استفاده از LOD به عنوان دانش پس زمینه استفاده شده است. همچنین از آن به عنوان ابزاری برای انجام تجزیه و تحلیل داده ها در تحقیقات زیست محیطی استفاده شده است. در این پژوهش در ابتدا با استفاده از زبان پرسوجوی وب معنایی SPARQL در محیط نقطه پایانی SPARQL دبیپدیا از مجموعه داده کتاب های چاپ شده در DBpedia استفاده شد. سپس با استفاده از سه روش از الگوریتم SPARQL موجود در افزونه داده های باز پیوندی (LOD) نرم افزار رپیدماینر به ایجاد و بررسی پیوند و اتصال به منبعی از اطلاعات مرتب شده، پرداخته شد. هدف از این اتصال افزودن دانش در پایگاه داده موجود از طریق ایجاد لینک به پایگاه داده ابری بزرگ (LOD) و استفاده از اطلاعات برای تکمیل پایگاه داده است. با این روش مجموعه داده اطلاعات اولیه کتاب به کمک ابزارهای وب معنایی و استخراج متادیتا با استفاده از عملگرهای داده کاوی در نرم افزار رپیدماینر به صورن خودکار غنی سازی شد.

کلیدواژه ها

استخراج دانش2، داده کاوی3، وب معنایی4، داده باز پیوندی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.