روشی جدید برای خوشه بندی مستندات متنی براساس آنتولوژی

احسان عسگریان; جعفر حبیبی; شهروز معاون; حسین معین زاده

روشی جدید برای خوشه بندی مستندات متنی براساس آنتولوژی

محل انتشار: سومین کنفرانس بین المللی فناوری اطلاعات و دانش

سال انتشار: 1386

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,766

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/49898

شناسه ملی سند علمی:

ICIKT03_064

تاریخ نمایه سازی: 22 فروردین 1387

چکیده مقاله:

امروزه خوشه بندی نقش حیاتی در روشهای بازیابی اطلاعات برای سازمانبندی مجموعه های بزرگ مستندات متنی مانند وب، درون تعداد کمی خوشه معنادار دارد . معمولا در خوشه بندی مستندات متنی با خوشه بندی ابعاد بسیار بالای فضای داده مواجه هستیم که بندی به این شکل، مشکل بنظر می رسد . علاوه بر این، معمولا با استفاده از الگوریتم های خوشه بندی متفاوت، نتایج متفاوتی بدست می آید و مستندات درون خوشه های بدست آمده نیز ارتباط معنایی لازم را با هم ندارند . برای حل این مشکلات ما هسته انجام خوشه آنتولوژی مانند وردنت را به عنوان دانش پس زمینه، درون فرایند خوشه بندی مستندات متنی جایگذاری نمودیم . سپس به صورت تجربی روش جدید را با تکنیکهای خوشه بندی ساده برای مجموعه داده خبرگزاری رویتر مقایسه نمودیم . نتایج بدست آمده از خوشه بندی متن همراه با استفاده از دانش پس زمینه در مقایسه با خوشه بندی متن بدون دانش پس زمینه، بهبود داشته است .

کلیدواژه ها:

آنتولوژی ، خوشه بندی ، دانش پس زمینه ، مفهوم

نویسندگان

دانشگاه صنعتی شریف

دانشگاه صنعتی شریف

دانشگاه صنعتی شریف

دانشگاه علم و صنعت

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

A. Hotho, S.Staab, G. Stumme, *Ontologies Improve Text Clustering , ...
M. Steinbach, G. Karypis, and V. Kumar. _ comparison of ...
A. Hotho, S.Staab, G. Stumme, _ _ nt ology-based Text ...
A. Hotho, S.Staab, G. Stumme, ،Text Clustering Based on Background ...
S. Bloehdorn, and A. Hotho, ،Text classification by boosting weak ...
C. Fellbaum, ،7ordNet: an electronic lexical database", MIT Press., 1998. ...
J. D. Velasquez, R. Weber, H. Yasuda, _ Methodology to ...
A. Hotho, A. Maedche, and S. Staab.، _ Onto logy-based ...
R. Xu, D. Wunsch, *Survey of Clustering Algorithm', IEEE Trans ...
A.K. Jain, M.N. Murty, and P.J. Flynn, ، Data Clustering: ...
G. Salton, and M. J. McGill, _ _ Introduction to ...
G. Salton, M. Lesk, *Computer Evaluation of Indexing and Text ...
S. Bloehdorn, P. Cimiano, A. Hotho and S.Staab, ،An O ...
Cl assification z Clustering ...

نمایش کامل مراجع