CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

طبقه بندی صفحه وب مبتنی بر آنتولوژی

عنوان مقاله: طبقه بندی صفحه وب مبتنی بر آنتولوژی
شناسه ملی مقاله: ECICONFE01_036
منتشر شده در اولین همایش بین المللی مهندسی برق،علوم کامپیوتر و فناوری اطلاعات در سال 1396
مشخصات نویسندگان مقاله:

زهره قاسمی

خلاصه مقاله:
طبقه بندی وب سایت ھا ھمواره یکی از چالش ھای وبکاوی در بازیابی اطلاعات از وب بوده است. در سال های اخیر استفاده از آنتولوژی به منظور افزایش دقت دسته بندی صفحات وب، مطرح شده است. آنتولوژی ارتباط بین مفاھیم در اسناد وب و دنیای واقعی را مشخص می کند که با این کار اسناد مربوطه توسط ماشین ھا قابل پردازش و فھم می شوند و اشتراک گذاری بین عامل ھا را تسھیل می نماید. در این مقاله ما یک تکنیک جدید جھت طبقه بندی صفحات وب مبتنی بر آنتولوژی پیشنھاد می دھیم تا این کار را با دقت و صحت بالایی انجام دھد. شناسایی و مقایسه معنا و روابط معنایی و محتوایی بین کلمات صفحه دقت و کارآمدی طبقه بندی را بالاتر خواھد برد. در مرحله اول کلمات یک صفحه وب استخراج و با استفاده از چند فاکتور وزنده ی شده و کلمات کلیدی مشخص می شوند، مرحله دوم میزان شباھت بین کلمات کلیدی از صفحه و آنتولوژی با استفاده از مفھوم IC اندازه گیری می شود. با استفاده از نتایج این اندازه گیری طبق صفحه مورد نظر را مشخص می گردد.

کلمات کلیدی:
طبقه بندی صفحات وب، آنتولوژی، شباهت معنایی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/678672/