روشی جدید برای خوشه بندی مستندات متنی فارسی براساس آنتولوژی
محل انتشار: همایش ملی علوم و مهندسی کامپیوتر
سال انتشار: 1391
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 987
فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NCCSE01_122
تاریخ نمایه سازی: 9 بهمن 1392
چکیده مقاله:
در دنیای امروزی بسیاری از اطلاعات به صورت انواع مختلفی از متون الکترونیکی ذخیره می شوند. جهت استخارج دانش از این متون، نیاز به سیستم های خوشه بندی خودکار است. با وجود رشد منابع اطلاعاتی فارسی، متأسفانه در حوزه خوشه بندی متون فارسی کارهای زیادی صورت نگرفته است. بیشترین تحقیقات انجام گرفته در این زمینه، مربوط به متون انگلیسی هستند که معمولاً قابل استفاده برای متون فارسی نیستند. بنابراین فقدان یک سیستم خوشه بندی کارآمد برای متون فارسی مشهود است. هدف این مقاله ارائه یک سیتستم برای خوشه بندی مفهومی متون فارسی می باشد که بتواند کیفیت خوشه بندی متون فارسی را بهبود ببخشد. در این مقاله دو راه ار جدید براساس آنتولوژی برای بهبود خوشه بندی مستندات فارسی ارائه شده است. نتایج تجربی حاصل از اجرای راهکارهای پیشنهادی روی 15 مجموعه داده انتخاب شده از متون همشهری، حاکی از بهبود کیفیت خوشه بندی نسبت به روشهای معمول است.
کلیدواژه ها:
آنتولوژی ، خوشه بندی مستندات فارسی
نویسندگان
ابوالفضل ولیزاده
دانشگاه آزاد اسلامی واحد شبستر
روح الله اعتمادی
دانشگاه آزاد اسلامی واحد بناب
شاهین اکبرپور
دانشگاه آزاد اسلامی واحد شبستر
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :