فشرده سازی متن فارسی با استفاده از الگوریتم های حسابی و هافمن و مقایسه آن با فشرده سازی متن انگلیسی

محسن هاشمی; محمدحسن ساوجی

فشرده سازی متن فارسی با استفاده از الگوریتم های حسابی و هافمن و مقایسه آن با فشرده سازی متن انگلیسی

محل انتشار: پانزدهیمن کنفرانس مهندسی برق ایران

سال انتشار: 1386

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 11,874

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/25147

شناسه ملی سند علمی:

ICEE15_078

تاریخ نمایه سازی: 17 بهمن 1385

چکیده مقاله:

در این مقاله فشرده سازی متن فارسی و تحلیل های آماری متن فارسی مورد بررسی قرار گرفته اند و دو الگوریتم معروف هافمن و حسابی از انواع و مراتب مختلف مدلها برای فشرده سازی متن فارسی پیاده سازی و از لحاظ میزان و سرعت فشرده سازی با هم مقایسه شده اند. این بررسی ها همچنین در مورد متن انگلیسی نیز انجام شده اند و نتایج آنها با هم مقایسه شده است. نتایج بدست آمده نشان می دهد که با وجود میزان فشرده سازی کمتر الگوریتم هافمن نسبت به الگوریتم حسابی (در حد 2-3 درصد) سرعت اجرای آن در حدود 40-50 برابر بیشتر از سرعت اجرای الگوریتم حسابی می باشد. همچنین این نتایج نشان می دهد که با توجه آنتروپی بالاتر متن فارسی نسبت به متن انگلیسی، متن فارسی دارای قابلیت فشرده پذیری کمتری نسبت به متن انگلیسی است. با استفاده از این نتایج برای الگوریتم حسابی وفقی طول بهینه ی هر بلوک برای کدگذاری متن با تقسیم بندی آن به بلوک های با طول ثابت، بدست آمد.

کلیدواژه ها:

آنتروپی ، الگوریتم حسابی ، الگوریتم هافمن ، فشرده سازی

نویسندگان

محسن هاشمی

دانشکده مهندسی برق و کامپیوتر دانشگاه شهید بهشتی

محمدحسن ساوجی

دانشکده مهندسی برق و کامپیوتر دانشگاه شهید بهشتی

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

- محسن هاشمی، "کدگذاری حسابی متن و مقایسه‌ی آن با ...
C.E. Shannon, "A mathematical theory of c ofmm unications, _ ...
D.A. Huffman, "A method for construction of minimum redundancy codes, ...
J.J. Rissanen and G.G. Longdon, "Arithmetic Coding, " IBM J. ...
I.H. Witten, R.M. Neal, and J.G. Cleary, "Arithmetic coding for ...
. Howard, P.G. and Vitter, J.S, "Arithmetic coding for data ...
ZIV, J. and LEMIPEL, A. " A universal algorithm for ...
T.C. Bell, I.H. Witten, and J. Cleary, Text Compression, Prentice ...
. Amir Said, "Introduction to Arithmetic Coding _ Theory and ...

نمایش کامل مراجع