ارائه یک رویکرد جدید برای بومی سازی خودکارآنتولوژی پایگاه شناخت در زبان فارسی به کمک NOSQL

  • سال انتشار: 1394
  • محل انتشار: دومین همایش ملی سیستم‌های هوشمند در مهندسی برق و کامپیوتر
  • کد COI اختصاصی: POWERMINOO02_048
  • زبان مقاله: فارسی
  • تعداد مشاهده: 784
دانلود فایل این مقاله

نویسندگان

مهدی اکبری

دانشجوی کارشناسی ارشد، گروه گامپیوتر، واحد تهران مرکز، دانشگاه آزاد اسلامی تهران، ایران

بابک وزیری

استادیار و دکتری، گروه کامپیوتر، واحد تهران مرکز، دانشگاه آزاد اسلامی تهران، ایران

چکیده

آنتولوژی 1(پایگاه شناخت) ثابت کرده است که به منظور افزایش برنامه های کاربردی مبتنی بر پردازش زبان طبیعی مانند استخراج اطلاعات از محتویات متفاوت ازجملهDBpedia بسیار کاربردی است. در زمینه وب معنایی نیز، منابع در شبکه می توانند با خوش تعریف بودن و قابل فهم بودن ابر داده ها برای ماشین، غنی سازی شوند بطوریکه مفاهیم، معانی و ارتباطات آنها با یکدیگر مشخص شوند. این ابر داده ها شامل توصیفاتی به زبان طبیعی از مفاهیم هستند. به تطبیق یک پایگاه شناخت به یک زبان و فرهنگ خاص بومی سازی گفته می شود که این مقاله بر روی آن تمرکز کرده است. در این مقاله، با هدف بومیسازی پایگاه شناخت، تطبیق پایگاه شناخت از زبان انگلیسی به زبان فارسی مورد توجه است. در روش و رویکرد پیشنهادی این مقاله از ترجمه آنلاین برای ترجمه کلمات استفاده شده است و سعی شده است تا بهترین نتایج حاصل گردد. با توجه با جایگاه زبان و فرهنگ فارسی و همچنین توجه کم به بومی سازی پایگاه شناخت در آن سعی شده است از مدل های مشابه در مقالاتمرتبط با زبان های متفاوت استفاده گردد. تفاوت این مقاله علاوه بر بومی سازی خودکار، ترکیب لایه های واژگانی با لایه مفهومی در پایگاه شناخت می باشد که به نوعی پدیدآوردنده یک معماری جدید نیز می باشد. همچنین در بحث جامعیت ازNOSQL استفاده شده است. در انتها ارزیابی دقیقی برای عملکرد بومی سازی انجام شده است که نتیجه موفقیت آمیزی در پی دارد.

کلیدواژه ها

هستی شناسی، بومی سازی آنتولوژی، پردازش واژگانی و معنایی، ارزیابی پایگاه شناخت، پایگاه دادهNOSQL

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.