用pigz代替gzip

pig是个啥东东?
官网:http://zlib.net/pigz
一句话简介:

A parallel implementation of gzip for modernmulti-processor, multi-core machines。

简单的说,就是支持并行的gzip。废话不多说,开始测试。

pig默认用当前逻辑cpu个数来并发压缩,无法检测个数的话,则并发8个线程。

一、测试压缩包文件1
压缩前
-rw-r--r-- 1 root root 2474772480 Dec  3 19:54 dbs.tar

1、gzip测试
压缩耗时,CPU最高:101.6%
real    2m18.042s
user    2m10.204s
sys     0m6.876s

解压缩耗时,CPU最高:101.6%
real    0m26.756s
user    0m20.175s
sys     0m6.580s

压缩后
-rw-r--r-- 1 root root 2349563863 Dec  3 19:54 dbs.tar.gz

2、pigz测试
并发8线程(默认):
压缩耗时,CPU最高:832%
real    0m21.710s
user    2m31.229s
sys     0m9.101s

解压缩耗时,CPU最高:199%
real    0m13.239s
user    0m11.791s
sys     0m12.426s

并发4线程:
压缩耗时,CPU最高:427.6%
real    0m38.299s
user    2m30.701s
sys     0m8.369s

解压缩耗时,CPU最高:202%
real    0m13.294s
user    0m12.154s
sys     0m11.862s

压缩后
-rw-r--r-- 1 root root 2350161547 Dec  3 19:54 dbs.tar.gz

二、测试压缩包文件2
压缩前
-rw-r--r-- 1 root root 5248890880 Dec  3 20:26 mysql-5.5.28-linux2.6-x86_64.tar

1、gzip测试
压缩耗时,CPU最高:101%
real    6m20.524s
user    6m2.466s
sys     0m7.410s

解压缩耗时,CPU最高: 101%
real    0m58.893s
user    0m46.258s
sys     0m11.944s

压缩后
-rw-r--r-- 1 root root 1410045513 Dec  3 20:26 mysql-5.5.28-linux2.6-x86_64.tar.gz

2、pigz测试
并发8线程(默认):
压缩耗时,CPU最高: 799%
real    1m11.908s
user    6m36.717s
sys     0m9.860s

解压缩耗时,CPU最高:179%
real    0m33.188s
user    0m38.069s
sys     0m16.728s

并发4线程:
压缩耗时,CPU最高: 418%
real    1m41.547s
user    6m36.782s
sys     0m9.806s

解压缩耗时,CPU最高: 179%
real    0m33.120s
user    0m37.500s
sys     0m16.956s

压缩后
-rw-r--r-- 1 root root 1406061442 Dec  3 20:26 mysql-5.5.28-linux2.6-x86_64.tar.gz

结论:

1、pigz默认用法(默认并发线程是逻辑cpu个数)可比gzip快5.3倍,CPU消耗则是gzip的8倍,压缩比则相当;
2、并发8线程对比4线程提升:41.2%,16线程对比8线程提升:27.9%,32线程对比16线程提升:3%;
3、在对压缩效率要求较高、但对短时间内CPU消耗较高不受影响的场景,使用pigz非常合适。
技术相关: 

评论

好文!
除了pigz,pbzip2和p7zip分别是对bz2和7z格式进行并行化