فشرده سازی متن فارسی با استفاده از الگوریتم های حسابی و هافمن و مقایسه آن با فشرده سازی متن انگلیسی
محل انتشار: پانزدهیمن کنفرانس مهندسی برق ایران
سال انتشار: 1386
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 11,634
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICEE15_078
تاریخ نمایه سازی: 17 بهمن 1385
چکیده مقاله:
در این مقاله فشرده سازی متن فارسی و تحلیل های آماری متن فارسی مورد بررسی قرار گرفته اند و دو الگوریتم معروف هافمن و حسابی از انواع و مراتب مختلف مدلها برای فشرده سازی متن فارسی پیاده سازی و از لحاظ میزان و سرعت فشرده سازی با هم مقایسه شده اند. این بررسی ها همچنین در مورد متن انگلیسی نیز انجام شده اند و نتایج آنها با هم مقایسه شده است. نتایج بدست آمده نشان می دهد که با وجود میزان فشرده سازی کمتر الگوریتم هافمن نسبت به الگوریتم حسابی (در حد 2-3 درصد) سرعت اجرای آن در حدود 40-50 برابر بیشتر از سرعت اجرای الگوریتم حسابی می باشد. همچنین این نتایج نشان می دهد که با توجه آنتروپی بالاتر متن فارسی نسبت به متن انگلیسی، متن فارسی دارای قابلیت فشرده پذیری کمتری نسبت به متن انگلیسی است. با استفاده از این نتایج برای الگوریتم حسابی وفقی طول بهینه ی هر بلوک برای کدگذاری متن با تقسیم بندی آن به بلوک های با طول ثابت، بدست آمد.
کلیدواژه ها:
نویسندگان
محسن هاشمی
دانشکده مهندسی برق و کامپیوتر دانشگاه شهید بهشتی
محمدحسن ساوجی
دانشکده مهندسی برق و کامپیوتر دانشگاه شهید بهشتی
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :