استخراج اطلاعات از وب سایت های خبری با استفاده از روش مبتنی بر آنتولوژی

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 652

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CECCONF07_003

تاریخ نمایه سازی: 24 مرداد 1398

چکیده مقاله:

در سال های اخیر با رشد روز افزون داده، منابع اطلاعاتی اهمیت بسزایی برای سازمان ها پیدا کرده است. بنابراین یافتن روش ها و تکنیک هایی برای دستیابی کارا به داده ها، اشتراک داده، استخراج اطلاعات از داده و استفاده از این اطلاعات، مورد توجه دانشمندان و پژوهشگران این حوزه قرار گرفته است. با ایجاد و گسترش وب و افزایش چشمگیر حجم اطلاعات، نیاز به این روش ها و تکنیک ها بیش از پیش احساس می شود. در حال حاضر بیش از دو بیلیون صفحه در وب موجود است و این تعداد با نرخ بالایی در روز در حال افزایش می باشند. با توجه به حجم وسیع اطلاعات در وب، مدیریت آن با ابزارهای سنتی تقریبا غیر ممکن است و ابزارها و روش هایی نو برای مدیریت آن مورد نیاز است . در این مقاله روشی با استفاده از آنتولوژی برای استخراج اطلاعات از وب سایت های خبری فارسی ارائه گردیده است، که متن اصلی صفحات خبری وب مورد نظر کاربر را با دقت بالایی منعکس می نماید.

نویسندگان

ویدا مظاهری

گروه مهندسی کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران، ایران

چنگیز دل آرا

گروه مهندسی کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران، ایران