خوشه بندی اسناد ایکس ام ال با رویکردی مبتنی بر سطح و هستی شناسی کلمات درشبکه های معنایی

سارا اسدی حقی; فریبرز محمودی

خوشه بندی اسناد ایکس ام ال با رویکردی مبتنی بر سطح و هستی شناسی کلمات درشبکه های معنایی

محل انتشار: دومین کنفرانس بین المللی بازشناسی الگو و تحلیل تصویر

سال انتشار: 1393

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 963

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/373464

شناسه ملی سند علمی:

IPRIA02_040

تاریخ نمایه سازی: 28 شهریور 1394

چکیده مقاله:

منابع متنی موجود در وب که دارای ساختار مبتنی بر ایکس ام ال می باشند به سرعت در حال افزایش هستند و یکی از روش هایمتداول برای سازماندهی آنها استفاده از شیوه های خوشه بندی می باشد. ارزیابی شباهت به عنوان یک مسئاله مهم در خوشه بندی مطرح استو الگوریتم های زیادی در این زمینه بر اساس ساختار و محتوا ارائه شدهاند. در خوشه بندی با چالش هایی مانند ابعاد بالا و دقت مواجه هستیم،در ارزیابی شباهت محتوا انتخاب کلمات کلیدی می تواند در رفع این چالش ها بسیار موثر باشد و استفاده از اطلاعات معنایی میتواند منجر بهانتخاب مناسب این کلمات شود، که این اطلاعات به صورت مجموعه های هستی شناسی مانند وردنت موجود می باشند. از این رو در این مقالهتمرکز بر استفاده از شبکه های معنایی به منظور کاهش ابعاد و افزایش دقت بوده و رویکرد پیشنهادی با تعیین سطوح کلمات در شبکه معنایی ومفاهیم نظریه اطلاعات و تشکیل زنجیره های معنایی کلمات و انتخاب کلمات کلیدی مناسب ارائه می شود، نتایج به دست آمده در مقایسه باکارهای گذشته نشان دهنده افزایش میانگین دقت و شاخص خوشه بندی به میزان 0.28 و 0.24 می باشد.

کلیدواژه ها:

ایکس ام ال ، خوشه بندی ، زنجیره کلمات ، شبکه های معنایی ، هستی شناسی

نویسندگان

سارا اسدی حقی

دانشجوی کارشناسی ارشد، گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد قزوین، قزوین، ایران

فریبرز محمودی

استادیار، گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد قزوین، قزوین، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

C. Bouras and V Tsogkas, "A clustering technique for news ...
_ _ _ _ _ Similarity in Vol.9, No.3, pp.343-349, ...
techniques in computing science and software engineering, pp.181-186, 2010. ...
Text Summarization Automated"ه [4]M. Pourvali and . Saniee Abadeh, Base ...
of hierarchical data using pq grams" ACM VLDB _ Proceedings ...
_ _ _ _ Distance and Inclusion", I [10] W. ...
W. Viyanon and S. K.Madria, "A System for Detecting XML ...
B. Liu and R. Grossman and Y. Zhai "Mining Web ...
P. Resnik, "Using Information Content to Evaluate Semantic Similarity in ...
L. kaufman and p. rOusseeuw, finding groups in data, wiley ...
Sense Wordء [16] A. Tagarelli and M. Longo and S. ...
S. Fodeh and B Punch and P. Ning Tan, _ ...
I. Czarnowski and P. J.edrzejowicz, "Agent-Based Non-distributed and Distributed Clustering" ...

نمایش کامل مراجع