CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

پیشرفت هایی در الگوریتم ها و نرم افزار متن کاوی

عنوان مقاله: پیشرفت هایی در الگوریتم ها و نرم افزار متن کاوی
شناسه ملی مقاله: CHKI01_059
منتشر شده در اولین همایش ملی فناوریهای نوین در علوم مهندسی در سال 1389
مشخصات نویسندگان مقاله:

احمد قلیچی - دانشجوی کارشناسی ارشد نرم افزار دانشگاه پیام نور تهران-واحدری
احمد فراهی - استادیار کامپیوتردانشکده فنی ومهندسی دانشگاه پیام نور-سازمان مرکزی-

خلاصه مقاله:
میزان اطلاعات متنی ذخیره شده روی کامپیوترهای شخصی یا روی وب به سرعت در حال افزایش است. هر کامپیوتر به علت پیشرفتی که در سخت افزارهای ذخیره سازی داشته، می تواند با میزان حجیمی از داده ها کار کند.جمع آوری اطلاعات آسان است ، یافتن اطلاعات وابسته در مسیر تقاضا می تواند سخت باشد.همچنان که اندازه اطلاعات سیر صعودی را دنبال می کند، ایجاد ساختارهای داده(ایندکس ها) برای بازیابی آسان اطلاعات وابسته پیچیده می شود. توانایی استخراج الگوها یا ویژگی های خاص برای یافتن اطلاعات منحصر بفرد مورد نیاز، مسئله مهمی در بازیابی اطلاعات می باشد. در این مقاله پیشرفتهای جدید در طراحی نرم افزارهایی برای ایجاد ایندکس های حجیم (نرم افزار تجزیه کننده متن عمومی(GTP) )و الگوریتم هایی برای استخراج الگوها از رسانه های متنی ارائه می شود.

کلمات کلیدی:
داده کاوی ، متن کاوی، شاخص گذاری ، بازیابی اطلاعات ، تجزیه کننده متن عمومی (GTP)

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/84377/