|
最近更新日期:2005年08月29日
本文已不再维护,更新文章请参考此处
1. 压缩文件案的用途与技术:
2. Linux 系统常见的压缩指令: 2.1 compress 2.2 gzip, zcat 2.3 bzip2, bzcat 2.4 tar 2.5 dd 2.6 cpio 3. 针对本文的建议:http://phorum.vbird.org/viewtopic.php?t=23882 大标题的图示压缩文件案的用途与技术:
您是否有过文件档案太大,导致无法以一片软盘将他复制完成的困扰?
又,您是否有过,发现一个软件里面有好多档案,这些档案要将他复制与携带都很不方便的问题?
还有,您是否有过要备份某些重要数据,偏偏这些数据量太大了,耗掉了你很多的硬盘与磁盘空间呢?
这个时候,那个好用的『文件压缩』技术可就派的上用场了!
因为这些比较大型的档案透过所谓的文件压缩技术之后,可以将他的磁盘使用量降低,
可以达到减低档案容量的效果,此外,有的压缩程序还可以进行容量限制,
使一个大型档案可以分割成为数个小型档案,以方便软盘片携带呢!
那么什么是『文件压缩』呢?我们来稍微谈一谈他的原理好了。目前我们使用的计算机系统中都是使用所谓的 bytes 单位来计量的!不过,事实上,计算机最小的计量单位应该是 bits 才对啊,此外,我们也知道 1 byte = 8 bits 。但是如果今天我们只是记忆一个数字,亦即是 1 这个数字呢?他会如何记录?假设一个 byte 可以看成底下的模样:
Tips: 由于 1 byte = 8 bits ,所以每个 byte 当中会有 8 个空格,而每个空格可以是 0, 1 ,这里仅是做为一个约略的介绍,读者不必刻意记忆。 鸟哥的图示 简单的说,你可以将他想成,其实档案里面有相当多的『空间』存在,并不是完全填满的, 而『压缩』的技术就是将这些『空间』填满,以让整个档案占用的容量下降! 不过,这些『压缩过的档案』并无法直接被我们的操作系统所使用的,因此, 若要使用这些被压缩过的档案数据,则必须将他『还原』回来未压缩前的模样, 那就是所谓的『解压缩』啰!而至于压缩前与压缩后的档案所占用的磁盘空间大小, 就可以被称为是『压缩比』啰!更多的技术文件或许你可以参考一下:
Tips: 这种技术蛮有趣的!他让您网站上面『看的到的数据』在经过网络传输时,使用的是『压缩过的数据』, 等到这些压缩过的数据到达你的计算机主机时,再进行解压缩,由于目前的计算机指令周期相当的快速, 因此其实在网页浏览的时候,时间都是花在『数据的传输』上面,而不是 CPU 的运算啦!,如此一来,由于压缩过的数据量降低了,自然传送的速度就会增快不少! 鸟哥的图示 大标题的图示Linux 系统常见的压缩指令:
如果您常常在网络上面捉 Linux 的数据下来玩的话,大概会晓得的是,这些供人下载的档案通常都是『压缩』过的!
为了什么?上面已经稍微提过啦!呵呵!压缩过的档案具有节省带宽、节省磁盘空间等等的优点,并且还方便携带呢!
^_^ !而,您应该也会知道,这些被压缩过的档案,通常其扩展名都是『
*.tar, *.tar.gz, *.tgz, *.gz, *.Z, *.bz2 』
等等的,为什么要订定这些压缩文件案扩展名为这样的模样呢?
这是因为在 Linux 上面压缩的指令相当的多,并且,这些压缩指令可能无法针对每种压缩文件案都可以解的开, 毕竟目前的压缩技术五花八门,每种压缩计算的方法都不是完全相同的,所以啰,当你捉到某个压缩文件时, 自然就需要知道压缩他的是那个指令啦,好用来对照着解压缩啊! ^_^!也就是说,虽然 Linux 档案的属性基本上是与文件名没有绝对关系的,能不能执行与他的文件属性有关而已, 与档名的关系很小!但是,为了帮助我们小小的人类脑袋瓜子,所以适当的文件名扩展名还是必要的! 因此,目前就有一些常常见到的压缩文件案的扩展名啦!我们仅列出常见的几样在底下,给大家权做参考之用:
在 Unix-Like 当中,有个软件很好玩,他就是 tar 这支程序!这个 tar 可以将很多档案『打包』成为一个档案! 甚至是目录也可以这么玩。不过,单纯的 tar 功能仅是『打包』而已,亦即是将很多档案集结成为一个档案,事实上,他并没有提供压缩的功能,后来, GNU 计划中,将整个 tar 与压缩的功能结合在一起,如此一来提供使用者更方便并且更强大的压缩与打包功能! 底下我们就来谈一谈这些在 Linux 底下基本的压缩指令吧! 小标题的图示compress [root@linux ~]# compress [-dcr] 档案或目录 参数: -d :用来解压缩的参数 -r :可以连同目录下的档案也同时给予压缩呢! -c :将压缩数据输出成为 standard output (输出到屏幕) 范例: 范例一:将 /etc/man.config 复制到 /tmp ,并加以压缩 [root@linux ~]# cd /tmp [root@linux tmp]# cp /etc/man.config . [root@linux tmp]# compress man.config [root@linux tmp]# ls -l -rw-r--r-- 1 root root 2605 Jul 27 11:43 man.config.Z 范例二:将刚刚的压缩文件解开 [root@linux tmp]# compress -d man.config.Z 范例三:将 man.config 压缩成另外一个档案来备份 [root@linux tmp]# compress -c man.config > man.config.back.Z [root@linux tmp]# ll man.config* -rw-r--r-- 1 root root 4506 Jul 27 11:43 man.config -rw-r--r-- 1 root root 2605 Jul 27 11:46 man.config.back.Z # 这个 -c 的参数比较有趣!他会将压缩过程的数据输出到屏幕上,而不是写入成为 # file.Z 档案。所以,我们可以透过数据流重导向的方法将数据输出成为另一个档名。 # 关于数据流重导向,我们会在 bash shell 当中详细谈论的啦! 另外,如果不想让原本的档案被更名成为 *.Z ,而想制作出另外的一个档名时,就可以利用数据流重导向, 亦即是那个大于 (>) 的符号,将原本应该在屏幕上面出现的数据给他储存到其他档案去。 当然,这要加上 -c 的参数才行〜关于数据流重导向,我们会在第三篇提到的!此外, compress 已经很少人在使用了, 因为这支程序无法解开 *.gz 的档案,而 gzip 则可以解决 *.Z 的档案, 所以,如果您的 distribution 上面没有 compress 的话,没有关系的喔! Tips: compress 使用的频率越来越低了,如果您还是想要练习这个指令的话, 在 FC4 里头,他是在 ucompress 这个套件名称的套件内。您可以参考 RPM 的方式来安装! 鸟哥的图示 小标题的图示gzip, zcat [root@linux ~]# gzip [-cdt#] 檔名 [root@linux ~]# zcat 檔名.gz 参数: -c :将压缩的数据输出到屏幕上,可透过数据流重导向来处理; -d :解压缩的参数; -t :可以用来检验一个压缩文件的一致性〜看看档案有无错误; -# :压缩等级,-1 最快,但是压缩比最差、-9 最慢,但是压缩比最好!预设是 -6 〜 范例: 范例一:将 /etc/man.config 复制到 /tmp ,并且以 gzip 压缩 [root@linux ~]# cd /tmp [root@linux tmp]# cp /etc/man.config . [root@linux tmp]# gzip man.config # 此时 man.config 会变成 man.config.gz ! 范例二:将范例一的档案内容读出来! [root@linux tmp]# zcat man.config.gz # 此时屏幕上会显示 man.config.gz 解压缩之后的档案内容!! 范例三:将范例一的档案解压缩 [root@linux tmp]# gzip -d man.config.gz 范例四:将范例三解开的 man.config 用最佳的压缩比压缩,并保留原本的档案 [root@linux tmp]# gzip -9 -c man.config > man.config.gz 至于 zcat 则是用来读取压缩文件数据内容的指令!假如我们刚刚压缩的档案是一个文本文件, 那么你还记得如何读取文本文件吗?!没错!就是使用 cat ,那么读取压缩文件呢?呵呵!就是使用 zcat 啰!由于 gzip 这个压缩指令主要想要用来取代 compress 的,所以 compress 的压缩文件案也可以使用 gzip 来解开喔!同时, zcat 这个指令可以同时读取 compress 与 gzip 的压缩文件呦! 小标题的图示bzip2, bzcat [root@linux ~]# bzip2 [-cdz] 檔名 [root@linux ~]# bzcat 檔名.bz2 参数: -c :将压缩的过程产生的数据输出到屏幕上! -d :解压缩的参数 -z :压缩的参数 -# :与 gzip 同样的,都是在计算压缩比的参数, -9 最佳, -1 最快! 范例: 范例一:将刚刚的 /tmp/man.config 以 bzip2 压缩 [root@linux tmp]# bzip2 -z man.config # 此时 man.config 会变成 man.config.bz2 ! 范例二:将范例一的档案内容读出来! [root@linux tmp]# bzcat man.config.bz2 # 此时屏幕上会显示 man.config.bz2 解压缩之后的档案内容!! 范例三:将范例一的档案解压缩 [root@linux tmp]# bzip2 -d man.config.bz2 范例四:将范例三解开的 man.config 用最佳的压缩比压缩,并保留原本的档案 [root@linux tmp]# bzip2 -9 -c man.config > man.config.bz2 好了,那么如果我想要读取这个档案的内容呢? 是否一定要解开?当然不需要啰!可以使用简便的 bzcat 这个指令来读取内容即可!例如上面的例子中, 我们可以使用 bzcat man.config.bz2 来读取数据而不需要解开!此外,当您要解开一个压缩文件时, 这个档案的名称为 .bz, .bz2, .tbz, .tbz2 等等,那么就可以尝试使用 bzip2 来解看看啦!当然啰,也可以使用 bunzip2 这个指令来取代 bzip2 -d 啰。 小标题的图示tar [root@linux ~]# tar [-cxtzjvfpPN] 档案与目录 .... 参数: -c :建立一个压缩文件案的参数指令(create 的意思); -x :解开一个压缩文件案的参数指令! -t :查看 tarfile 里面的档案! 特别注意,在参数的下达中, c/x/t 仅能存在一个!不可同时存在! 因为不可能同时压缩与解压缩。 -z :是否同时具有 gzip 的属性?亦即是否需要用 gzip 压缩? -j :是否同时具有 bzip2 的属性?亦即是否需要用 bzip2 压缩? -v :压缩的过程中显示档案!这个常用,但不建议用在背景执行过程! -f :使用档名,请留意,在 f 之后要立即接档名喔!不要再加参数! 例如使用『 tar -zcvfP tfile sfile』就是错误的写法,要写成 『 tar -zcvPf tfile sfile』才对喔! -p :使用原档案的原来属性(属性不会依据用户而变) -P :可以使用绝对路径来压缩! -N :比后面接的日期(yyyy/mm/dd)还要新的才会被打包进新建的档案中! --exclude FILE:在压缩的过程中,不要将 FILE 打包! 范例: 范例一:将整个 /etc 目录下的档案全部打包成为 /tmp/etc.tar [root@linux ~]# tar -cvf /tmp/etc.tar /etc <==仅打包,不压缩! [root@linux ~]# tar -zcvf /tmp/etc.tar.gz /etc <==打包后,以 gzip 压缩 [root@linux ~]# tar -jcvf /tmp/etc.tar.bz2 /etc <==打包后,以 bzip2 压缩 # 特别注意,在参数 f 之后的档案档名是自己取的,我们习惯上都用 .tar 来作为辨识。 # 如果加 z 参数,则以 .tar.gz 或 .tgz 来代表 gzip 压缩过的 tar file 〜 # 如果加 j 参数,则以 .tar.bz2 来作为扩展名啊〜 # 上述指令在执行的时候,会显示一个警告讯息: # 『tar: Removing leading `/' from member names』那是关于绝对路径的特殊设定。 范例二:查阅上述 /tmp/etc.tar.gz 档案内有哪些档案? [root@linux ~]# tar -ztvf /tmp/etc.tar.gz # 由于我们使用 gzip 压缩,所以要查阅该 tar file 内的档案时, # 就得要加上 z 这个参数了!这很重要的! 范例三:将 /tmp/etc.tar.gz 档案解压缩在 /usr/local/src 底下 [root@linux ~]# cd /usr/local/src [root@linux src]# tar -zxvf /tmp/etc.tar.gz # 在预设的情况下,我们可以将压缩文件在任何地方解开的!以这个范例来说, # 我先将工作目录变换到 /usr/local/src 底下,并且解开 /tmp/etc.tar.gz , # 则解开的目录会在 /usr/local/src/etc 呢!另外,如果您进入 /usr/local/src/etc # 则会发现,该目录下的文件属性与 /etc/ 可能会有所不同喔! 范例四:在 /tmp 底下,我只想要将 /tmp/etc.tar.gz 内的 etc/passwd 解开而已 [root@linux ~]# cd /tmp [root@linux tmp]# tar -zxvf /tmp/etc.tar.gz etc/passwd # 我可以透过 tar -ztvf 来查阅 tarfile 内的文件名,如果单只要一个档案, # 就可以透过这个方式来下达!注意到! etc.tar.gz 内的根目录 / 是被拿掉了! 范例五:将 /etc/ 内的所有文件备份下来,并且保存其权限! [root@linux ~]# tar -zcvpf /tmp/etc.tar.gz /etc # 这个 -p 的属性是很重要的,尤其是当您要保留原本档案的属性时! 范例六:在 /home 当中,比 2005年06月01日 新的档案才备份 [root@linux ~]# tar -N '2005/06/01' -zcvf home.tar.gz /home 范例七:我要备份 /home, /etc ,但不要 /home/dmtsai [root@linux ~]# tar --exclude /home/dmtsai -zcvf myfile.tar.gz /home/* /etc 范例八:将 /etc/ 打包后直接解开在 /tmp 底下,而不产生档案! [root@linux ~]# cd /tmp [root@linux tmp]# tar -cvf - /etc | tar -xvf - # 这个动作有点像是 cp -r /etc /tmp 啦〜依旧是有其有用途的! # 要注意的地方在于输出档变成 - 而输入档也变成 - ,又有一个 | 存在〜 # 这分别代表 standard output, standard input 与管线命令啦! # 这部分我们会在 Bash shell 时,再次提到这个指令跟大家再解释啰! 『 tar 用来作备份是很重要的指令! 』而由于 tar 整合过后的档案我们通常会取名为 *.tar ,而如果还含有 gzip 的压缩属性,那么就取名为 *.tar.gz 啰!取这个文件名只是为了方便我们记忆这个档案是什么属性罢了!并没有实际的意义在!
另外,需要注意的是,在使用的参数方面,有还有几个有用的参数需要来了解一番,亦即是
-p 与 -P 这两个!在我们的范例一当中,有提到一个警告讯息,那就是『
tar: Removing leading `/' from member names』
意思是说, tar 将 /etc 目录的那个 / 拿掉了!这是因为担心未来你在解开压缩的时候,会产生一些困扰,
因为在 tar 里面的档案如果是具有『绝对路径』的话,那么你解开的档案将会『一定』在该路径下也就是
/etc,而不是相对路径 (这里请用心的想一想!) 。
这样子的最大困扰是,万一有人拿走了你的这个档案,并且将该档案在他的系统上面解开!万一他的系统上面正巧也有 /etc 这个目录 (那当然是一定有的啊!),哈哈!他的档案就会『正巧』被覆盖了! 所以啰,在预设的情况中,如果是以『绝对路径』来建立打包档案,那么 tar 将会自动的将 / 拿掉!这是为了刚刚说明的『安全』为前提所做的默认值。好了!但是你就是要以绝对路径来建立打包的档案!那么就加入 -P 这个参数吧 (请注意!是大写字符) !这样就可以啦! 那么 -p 是什么 (小写字符) ?呵呵!那个 -p 是 permission 的意思,也就是『权限』啦!使用 -p 之后,被打包的档案将不会依据使用者的身份来改变权限喔!
这里还有一个值得注意的参数呦!那就是在备份的情况中很常使用的 -N 的这个参数!
你可以参考一下上面的例子就可以知道啦!在这个例子当中,相当重要的就是那个日期啦!
在备份的情况当中,我们都希望只要备份较新的档案就好了,为什么呢?因为旧的档案我们已经有备份啰!
干嘛还要再备份一次,浪费时间也浪费系统资源!这个时候此一参数就显的相当的重要了啊!
在上面的例子中,最后一个例子很有趣『tar cvf - /etc | tar -xvf -
』!他是直接以管线命令『 pipe 』来进行压缩、解压缩的过程!在上面的例子中,我们想要『将
/etc 底下的数据直接 copy 到目前所在的路径,也就是 /tmp 底下来』,但是又觉得使用
cp -r 有点麻烦,那么就直接以这个打包的方式来打包,其中,指令里面的
- 就是表示那个被打包的档案啦!由于我们不想要让中间档案存在,所以就以这一个方式来进行复制的行为啦!
tar 的功能相当的多,而由于他是经由『打包』之后再处理的一个过程,所以常常我们会听到
tarball 的档案,那就是经由 tar 打包再压缩的档案啦!
而如果仅是打包而没有压缩的话,我们就称为 tarfile 啰〜此外, tar
也可以用在备份的储存媒体上面,最常见的就是磁带机了!假设我的磁带机代号为
/dev/st0 ,那么我要将我的 /home 底下的数据都给他备份上去时,就是使用
tar /dev/st0 /home 就可以啦!很不错吧!
在 Linux 当中, gzip 已经被整合在 tar 里面了!但是 Sun 或者其他较旧的 Unix 版本中, 当中的
tar 并没有整合 gzip ,所以如果你需要解压缩的话,就需要这么做:
tar -xvf testing.tar 小标题的图示dd
我们在上一章当中,在制作出 swap file 时,使用过 dd 这个指令对吧?!
不过,这个指令可不只是制作一个档案而已喔〜这个 dd 指令最大的功效,鸟哥认为,应该是在于『备份』啊!
因为 dd 可以读取装置的内容,然后将整个装置备份成一个档案呢!真的是相当的好用啊〜
dd 的用途有很多啦〜但是我们仅讲一些比较重要的参数,如下:
[root@linux ~]# dd if="input_file" of="output_file" bs="block_size" \ count="number" 参数: if :就是 input file 啰〜也可以是装置喔! of :就是 output file 喔〜也可以是装置; bs :规划的一个 block 的大小,如果没有设定时,预设是 512 bytes count:多少个 bs 的意思。 范例: 范例一:将 /etc/passwd 备份到 /tmp/passwd.back 当中 [root@linux ~]# dd if=/etc/passwd of=/tmp/passwd.back 3+1 records in 3+1 records out [root@linux ~]# ll /etc/passwd /tmp/passwd.back -rw-r--r-- 1 root root 1746 Aug 25 14:16 /etc/passwd -rw-r--r-- 1 root root 1746 Aug 29 16:57 /tmp/passwd.back # 仔细的看一下,我的 /etc/passwd 档案大小为 1746 bytes,因为我没有设定 bs , # 所以默认是 512 bytes 为一个单位,因此,上面那个 3+1 表示有 3 个完整的 # 512 bytes,以及未满 512 bytes 的另一个 block 的意思啦! # 事实上,感觉好像是 cp 这个指令啦〜 范例二:备份 /dev/hda 的 MBR [root@linux ~]# dd if=/dev/hda of=/tmp/mbr.back bs=512 count=1 1+0 records in 1+0 records out # 这就得好好了解一下啰〜我们知道整颗硬盘的 MBR 为 512 bytes, # 就是放在硬盘的第一个 sector 啦,因此,我可以利用这个方式来将 # MBR 内的所有数据都纪录下来,真的很厉害吧! ^_^ 范例三:将整个 /dev/hda1 partition 备份下来。 [root@linux ~]# dd if=/dev/hda1 of=/some/path/filename # 这个指令很厉害啊!将整个 partition 的内容全部备份下来〜 # 后面接的 of 必须要不是在 /dev/hda1 的目录内啊〜否则,怎么读也读不完〜 # 这个动作是很有效用的,如果改天你必须要完整的将整个 partition 的内容填回去, # 则可以利用 dd if=/some/file of=/dev/hda1 来将数据写入到硬盘当中。 # 如果想要整个硬盘备份的话,就类似 Norton 的 ghost 软件一般, # 由 disk 到 disk ,嘿嘿〜利用 dd 就可以啦〜厉害厉害! 小标题的图示cpio
这个指令可有趣了!他是透过数据流重导向的方法来将档案进行输出/输入的一个方式〜
因为我们尚未提到数据流重导向,所以,您可以先略过这的指令的练习。等到后续的章节读完后,
再来这个章节瞧一瞧!
[root@linux ~]# cpio -covB > [file|device] <==备份 [root@linux ~]# cpio -icduv < [file|device] <==还原 参数: -o :将数据 copy 输出到档案或装置上 -i :将数据自档案或装置 copy 出来系统当中 -t :查看 cpio 建立的档案或装置的内容 -c :一种较新的 portable format 方式储存 -v :让储存的过程中文件名可以在屏幕上显示 -B :让预设的 Blocks 可以增加至 5120 bytes ,预设是 512 bytes ! 这样的好处是可以让大档案的储存速度加快(请参考 i-nodes 的观念) -d :自动建立目录!由于 cpio 的内容可能不是在同一个目录内, 如此的话在反备份的过程会有问题! 这个时候加上 -d 的话, 就可以自动的将需要的目录建立起来了! -u :自动的将较新的档案覆盖较旧的档案! 范例: 范例一:将所有系统上的数据通通写入磁带机内! [root@linux ~]# find / -print | cpio -covB > /dev/st0 # 一般来说,使用 SCSI 接口的磁带机,代号是 /dev/st0 喔! 范例二:检查磁带机上面有什么档案? [root@linux ~]# cpio -icdvt < /dev/st0 [root@linux ~]# cpio -icdvt < /dev/st0 > /tmp/content # 第一个动作当中,会将磁带机内的文件名列出到屏幕上面,而我们可以透过第二个动作, # 将所有的文件名通通纪录到 /tmp/content 档案去! 范例三:将磁带上的数据还原回来〜 [root@linux ~]# cpio -icduv < /dev/st0 # 一般来说,使用 SCSI 接口的磁带机,代号是 /dev/st0 喔! 范例四:将 /etc 底下的所有『档案』都备份到 /root/etc.cpio 中! [root@linux ~]# find /etc -type f | cpio -o > /root/etc.cpio # 这样就能够备份啰〜您也可以将数据以 cpio -i < /root/etc.cpio # 来将资料捉出来!!!! 这个 cpio 好像不怎么好用呦!但是,嘿嘿!他可是备份的时候的一项利器呢!因为他可以备份任何的档案, 包括 /dev 底下的任何装置档案!呵呵!所以他可是相当重要的呢!!您说是吧! 而由于 cpio 必需要配合其他的程序,例如 find 来建立档名,所以, cpio 与管线命令及数据流重导向的相关性就相当的重要了! 2003年02月09日:第一次完成 2003年05月05日:修改 tar 的部分内容,尤其是 -P 这个参数的配合用法 2005年07月26日:将旧有的文章移动到 这里 2005年07月27日:大略修改了一些风格,另外,动作较大的是在范例的部分! 2005年08月29日:加入了 dd 这个有趣的指令喔! 2006年05月02日:将原本『tar -zxvpf /tmp/etc.tar.gz /etc』修改为『tar -zcvpf /tmp/etc.tar.gz /etc』 感谢讨论区网友 chinu 提供的信息。 |
|
本网页主要以Firefox配合解析度 1024x768 作为设计依据 鸟哥自由软件整合应用研究室