CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

استفاده از خوشه بندی و خلاصه سازی اسناد جهت نمایه سازی معنایی پنهان توزیع شده

عنوان مقاله: استفاده از خوشه بندی و خلاصه سازی اسناد جهت نمایه سازی معنایی پنهان توزیع شده
شناسه ملی مقاله: IDMC03_026
منتشر شده در سومین کنفرانس داده کاوی در سال 1388
مشخصات نویسندگان مقاله:

مهدی به شامه - عضو هیئت علمی دانشگاه آزاد اسلامی واحد تویسرکان
حسن بشیری - عضو هیئت علمی دانشگاه صنعتی همدان

خلاصه مقاله:
نمایه سازی معنایی پنهان یک روش مفهومی در سیستم های بازیابی اطلاعات می باشد دراین روش ماتریس کلمه - سند با استفاده از روشهای وزن دهی کلمات ساخته می شود این ماتریس با روشهای تجزیه ریاضی مانند تجزیه مقادیر منفرد به یک فضای مفهومی نگاشته می شود اگر تعداد کلمات و اسناد افزایش یابد انگاه به طور فزاینده ای به درایه های ماتریس کلمه - سند افزوده می شود که باعث ایجادمشکلاتی از قبیل افزایش بسیار زیاد مصرف حافظه و هزینه های محاسباتی خواهد شد با این فرض که استفاده از توزیع اسناد باعث کاهش حافظه مورد نیاز و هزینه های اجرا می شود ما یک روش نمایه سازی معنایی پنهان را طراحی و پیاده سازی نمودیم. دراین روش با خوشه بندی اسناد و خلاصه سازی اسناد جهت بهتر شدن کارایی نیز ترکیب شده است دراین ترکیب ماتریس کلمه - سند به ازای هر خوشه دوباره ایجاد م یشود و بازیابی براساس ماتریس کلمه - سند هر خوشه انجام می گیرد ما روش ارائه شده خود را با استفاده از اسناد Hamshahri Collection که مجموعه ای از اخبار فارسی است مورد ارزیابی قرا رداده ایم ارزیابی ها نشان داد که روش ترکیبی کارایی بهتری نسبت به روش غیرترکیبی دارد.

کلمات کلیدی:
بازیابی اطلاعات، نمایه سازی معنایی پنهان، خوشه بندی، دقت و فراخوانی، خلاصه سازی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/108898/