استخراج اطلاعات از وب سایت های خبری با استفاده از روش مبتنی بر آنتولوژی

ویدا مظاهری; چنگیز دل آرا

استخراج اطلاعات از وب سایت های خبری با استفاده از روش مبتنی بر آنتولوژی

محل انتشار: هفتمین کنفرانس ملی علوم و مهندسی کامپیوتر و فناوری اطلاعات

سال انتشار: 1398

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 844

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/913308

شناسه ملی سند علمی:

CECCONF07_003

تاریخ نمایه سازی: 24 مرداد 1398

چکیده مقاله:

در سال های اخیر با رشد روز افزون داده، منابع اطلاعاتی اهمیت بسزایی برای سازمان ها پیدا کرده است. بنابراین یافتن روش ها و تکنیک هایی برای دستیابی کارا به داده ها، اشتراک داده، استخراج اطلاعات از داده و استفاده از این اطلاعات، مورد توجه دانشمندان و پژوهشگران این حوزه قرار گرفته است. با ایجاد و گسترش وب و افزایش چشمگیر حجم اطلاعات، نیاز به این روش ها و تکنیک ها بیش از پیش احساس می شود. در حال حاضر بیش از دو بیلیون صفحه در وب موجود است و این تعداد با نرخ بالایی در روز در حال افزایش می باشند. با توجه به حجم وسیع اطلاعات در وب، مدیریت آن با ابزارهای سنتی تقریبا غیر ممکن است و ابزارها و روش هایی نو برای مدیریت آن مورد نیاز است . در این مقاله روشی با استفاده از آنتولوژی برای استخراج اطلاعات از وب سایت های خبری فارسی ارائه گردیده است، که متن اصلی صفحات خبری وب مورد نظر کاربر را با دقت بالایی منعکس می نماید.

کلیدواژه ها:

وب کاوی ، خبر فارسی ، آنتولوژی

نویسندگان

ویدا مظاهری

گروه مهندسی کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران، ایران

چنگیز دل آرا

گروه مهندسی کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران، ایران