鸟哥的 Linux 私房菜 -- Linux 的文件压缩与打包

since2012/04/23

最近更新日期:2005年08月29日

本文已不再维护,更新文章请参考此处

在 Linux 底下有相当多的压缩指令可以运作喔!这些压缩指令可以让我们更方便从网络上面下载大型的档案呢! 此外,我们知道在 Linux 底下的扩展名是没有什么很特殊的意义的,不过,针对这些压缩指令所做出来的压缩文件, 为了方便记忆,还是会有一些特殊的命名方式啦!就让我们来看看吧!

1. 压缩文件案的用途与技术:
2. Linux 系统常见的压缩指令:
2.1 compress
2.2 gzip, zcat
2.3 bzip2, bzcat
2.4 tar
2.5 dd
2.6 cpio
3. 针对本文的建议:http://phorum.vbird.org/viewtopic.php?t=23882

大标题的图示压缩文件案的用途与技术:

您是否有过文件档案太大,导致无法以一片软盘将他复制完成的困扰? 又,您是否有过,发现一个软件里面有好多档案,这些档案要将他复制与携带都很不方便的问题? 还有,您是否有过要备份某些重要数据,偏偏这些数据量太大了,耗掉了你很多的硬盘与磁盘空间呢? 这个时候,那个好用的『文件压缩』技术可就派的上用场了! 因为这些比较大型的档案透过所谓的文件压缩技术之后,可以将他的磁盘使用量降低, 可以达到减低档案容量的效果,此外,有的压缩程序还可以进行容量限制, 使一个大型档案可以分割成为数个小型档案,以方便软盘片携带呢!

那么什么是『文件压缩』呢?我们来稍微谈一谈他的原理好了。目前我们使用的计算机系统中都是使用所谓的 bytes 单位来计量的!不过,事实上,计算机最小的计量单位应该是 bits 才对啊,此外,我们也知道 1 byte = 8 bits 。但是如果今天我们只是记忆一个数字,亦即是 1 这个数字呢?他会如何记录?假设一个 byte 可以看成底下的模样:

□

しろいしかく

□

しろいしかく

□

しろいしかく

□

しろいしかく

□

しろいしかく

□

しろいしかく

□

しろいしかく

□

しろいしかく

Tips:
由于 1 byte = 8 bits ,所以每个 byte 当中会有 8 个空格,而每个空格可以是 0, 1 ,这里仅是做为一个约略的介绍,读者不必刻意记忆。鸟哥的图示

而由于我们记录数字是 1 ,考虑计算机所谓的二进制喔,如此一来, 1 会在最右边占据 1 个 bit ,而其他的 7 个 bits 将会自动的被填上 0 啰!你看看,其实在这样的例子中,那 7 个 bits 应该是『空的』才对!不过,为了要满足目前我们的操作系统数据的存取,所以就会将该数据转为 byte 的型态来记录了!而一些聪明的计算机工程师就利用一些复杂的计算方式, 将这些没有使用到的空间『丢』出来,以让档案占用的空间变小!这就是压缩的技术啦!

简单的说,你可以将他想成,其实档案里面有相当多的『空间』存在,并不是完全填满的, 而『压缩』的技术就是将这些『空间』填满,以让整个档案占用的容量下降! 不过,这些『压缩过的档案』并无法直接被我们的操作系统所使用的,因此, 若要使用这些被压缩过的档案数据,则必须将他『还原』回来未压缩前的模样, 那就是所谓的『解压缩』啰!而至于压缩前与压缩后的档案所占用的磁盘空间大小, 就可以被称为是『压缩比』啰!更多的技术文件或许你可以参考一下:

RFC 1952 文件:http://www.faqs.org/rfcs/rfc1952.html
鸟哥站上的备份: http://linux.vbird.org/linux_basic/0240tarcompress/0240tarcompress_gzip.php

这个『压缩』与『解压缩』的动作有什么好处呢?最大的好处就是压缩过的档案容量变小了, 所以你的硬盘容量无形之中就可以容纳更多的数据,此外,在一些网络数据的传输中,也会由于数据量的降低, 好让网络带宽可以用来作更多的工作!而不是老是卡在一些大型的档案上面呢!目前很多的 WWW 网站也是利用文件压缩的技术来进行数据的传送,好让网站的可利用率上升喔!

Tips:
这种技术蛮有趣的!他让您网站上面『看的到的数据』在经过网络传输时,使用的是『压缩过的数据』, 等到这些压缩过的数据到达你的计算机主机时,再进行解压缩,由于目前的计算机指令周期相当的快速, 因此其实在网页浏览的时候,时间都是花在『数据的传输』上面,而不是 CPU 的运算啦!,如此一来,由于压缩过的数据量降低了,自然传送的速度就会增快不少! 鸟哥的图示

若您是一位软件工程师,那么相信您也会喜欢将你自己的软件压缩之后提供大家下载来使用, 毕竟没有人喜欢自己的网站天天都是带宽满载的吧?!举个例子来说, Linux 2.4.19 完整的核心大小约有 200 MB 左右,而由于核心主要多是 ASCII code 的纯文本型态档案,这种档案的『多余空间』最多了。而一个提供下载的压缩过的 2.4.19 核心大约仅有 30MB 左右,差了几倍呢?您可以自己算一算喔!

大标题的图示Linux 系统常见的压缩指令:

如果您常常在网络上面捉 Linux 的数据下来玩的话,大概会晓得的是,这些供人下载的档案通常都是『压缩』过的! 为了什么?上面已经稍微提过啦!呵呵!压缩过的档案具有节省带宽、节省磁盘空间等等的优点,并且还方便携带呢! ^_^ !而,您应该也会知道,这些被压缩过的档案,通常其扩展名都是『 *.tar, *.tar.gz, *.tgz, *.gz, *.Z, *.bz2 』等等的,为什么要订定这些压缩文件案扩展名为这样的模样呢?

这是因为在 Linux 上面压缩的指令相当的多,并且,这些压缩指令可能无法针对每种压缩文件案都可以解的开, 毕竟目前的压缩技术五花八门,每种压缩计算的方法都不是完全相同的,所以啰,当你捉到某个压缩文件时, 自然就需要知道压缩他的是那个指令啦,好用来对照着解压缩啊! ^_^!也就是说,虽然 Linux 档案的属性基本上是与文件名没有绝对关系的,能不能执行与他的文件属性有关而已, 与档名的关系很小!但是,为了帮助我们小小的人类脑袋瓜子,所以适当的文件名扩展名还是必要的! 因此,目前就有一些常常见到的压缩文件案的扩展名啦!我们仅列出常见的几样在底下,给大家权做参考之用:

*.Z compress 程序压缩的档案;

*.bz2 bzip2 程序压缩的档案;

*.gz gzip 程序压缩的档案;

*.tar tar 程序打包的数据,并没有压缩过;

*.tar.gz tar 程序打包的档案,其中并且经过 gzip 的压缩

目前常见的压缩程序主要就是如同上面提到的扩展名对应的那些指令啦!最早期的要算是 compress 这个家伙了,不过这个 compress 指令目前已经不再是默认的压缩软件了〜而后,后来的 GNU 计划开发出新一代的压缩指令 gzip ( GNU zip ) 用来取代 compress 这个老牌的压缩指令,再来还有 bzip2 这个压缩比更好的压缩指令呢!不过,这些指令通常仅能针对一个档案来压缩与解压缩,如此一来, 每次压缩与解压缩都要一大堆档案,岂不烦人?此时,那个所谓的『打包软件』就显的很重要啦!

在 Unix-Like 当中,有个软件很好玩,他就是 tar 这支程序!这个 tar 可以将很多档案『打包』成为一个档案! 甚至是目录也可以这么玩。不过,单纯的 tar 功能仅是『打包』而已,亦即是将很多档案集结成为一个档案,事实上,他并没有提供压缩的功能,后来, GNU 计划中,将整个 tar 与压缩的功能结合在一起,如此一来提供使用者更方便并且更强大的压缩与打包功能! 底下我们就来谈一谈这些在 Linux 底下基本的压缩指令吧!

小标题的图示compress

[root@linux ~]# compress [-dcr] 档案或目录
参数:
-d :用来解压缩的参数
-r :可以连同目录下的档案也同时给予压缩呢!
-c :将压缩数据输出成为 standard output (输出到屏幕)
范例:
范例一:将 /etc/man.config 复制到 /tmp ,并加以压缩
[root@linux ~]# cd /tmp
[root@linux tmp]# cp /etc/man.config .
[root@linux tmp]# compress man.config
[root@linux tmp]# ls -l
-rw-r--r-- 1 root root 2605 Jul 27 11:43 man.config.Z
范例二:将刚刚的压缩文件解开
[root@linux tmp]# compress -d man.config.Z
范例三:将 man.config 压缩成另外一个档案来备份
[root@linux tmp]# compress -c man.config > man.config.back.Z
[root@linux tmp]# ll man.config*
-rw-r--r-- 1 root root 4506 Jul 27 11:43 man.config
-rw-r--r-- 1 root root 2605 Jul 27 11:46 man.config.back.Z
# 这个 -c 的参数比较有趣!他会将压缩过程的数据输出到屏幕上,而不是写入成为 
# file.Z 档案。所以,我们可以透过数据流重导向的方法将数据输出成为另一个档名。
# 关于数据流重导向,我们会在 bash shell 当中详细谈论的啦!

这是用来压缩与解压缩扩展名为 *.Z 的指令!所以看到 *.Z 的档案时,就应该要知道他是经由 compress 这个程序压缩的呦!这是最简单的压缩指令啰!不过,使用的时候需要特别留意的是, 当你以 compress 压缩之后,如果没有下达其他的参数,那么原本的档案就会被后来的 *.Z 所取代!以上面的案例来说明:原本压缩的档案为 man.config ,那么当压缩完成之后,将只会剩下 man.config.Z 这个经过压缩的档案啰!那么解压缩呢?呵呵,则是将 man.config.Z 解压缩成 man.config ! 使用上很简单啦!解压缩除了可以使用 compress –d 这个参数之外,也可以直接使用 uncompress !意思相同啦!

另外,如果不想让原本的档案被更名成为 *.Z ,而想制作出另外的一个档名时,就可以利用数据流重导向, 亦即是那个大于 (>) 的符号,将原本应该在屏幕上面出现的数据给他储存到其他档案去。当然,这要加上 -c 的参数才行〜关于数据流重导向,我们会在第三篇提到的!此外, compress 已经很少人在使用了, 因为这支程序无法解开 *.gz 的档案,而 gzip 则可以解决 *.Z 的档案, 所以,如果您的 distribution 上面没有 compress 的话,没有关系的喔!

Tips:
compress 使用的频率越来越低了,如果您还是想要练习这个指令的话, 在 FC4 里头,他是在 ucompress 这个套件名称的套件内。您可以参考 RPM 的方式来安装! 鸟哥的图示

小标题的图示gzip, zcat

[root@linux ~]# gzip [-cdt#] 檔名
[root@linux ~]# zcat 檔名.gz
参数:
-c :将压缩的数据输出到屏幕上,可透过数据流重导向来处理;
-d :解压缩的参数;
-t :可以用来检验一个压缩文件的一致性〜看看档案有无错误;
-# :压缩等级,-1 最快,但是压缩比最差、-9 最慢,但是压缩比最好!预设是 -6 〜
范例:
范例一:将 /etc/man.config 复制到 /tmp ,并且以 gzip 压缩
[root@linux ~]# cd /tmp 
[root@linux tmp]# cp /etc/man.config . 
[root@linux tmp]# gzip man.config 
# 此时 man.config 会变成 man.config.gz !
范例二:将范例一的档案内容读出来!
[root@linux tmp]# zcat man.config.gz
# 此时屏幕上会显示 man.config.gz 解压缩之后的档案内容!!
范例三:将范例一的档案解压缩
[root@linux tmp]# gzip -d man.config.gz
范例四:将范例三解开的 man.config 用最佳的压缩比压缩,并保留原本的档案
[root@linux tmp]# gzip -9 -c man.config > man.config.gz

gzip 是用来压缩与解压缩扩展名为 *.gz 的指令!所以看到 *.gz 的档案时,就应该要知道他是经由 gzip 这个程序压缩的呦!另外, gzip 也提供压缩比的服务! -1 是最差的压缩比,但是压缩速度最快,而 -9 虽然可以达到较佳的压缩比 (经过压缩之后,档案比较小一些!) ,但是却会损失一些速度!预设是 -6 这个数值! gzip 也是相当常使用的一个压缩指令呢!

至于 zcat 则是用来读取压缩文件数据内容的指令!假如我们刚刚压缩的档案是一个文本文件, 那么你还记得如何读取文本文件吗?!没错!就是使用 cat ,那么读取压缩文件呢?呵呵!就是使用 zcat 啰!由于 gzip 这个压缩指令主要想要用来取代 compress 的,所以 compress 的压缩文件案也可以使用 gzip 来解开喔!同时, zcat 这个指令可以同时读取 compress 与 gzip 的压缩文件呦!

小标题的图示bzip2, bzcat

[root@linux ~]# bzip2 [-cdz] 檔名
[root@linux ~]# bzcat 檔名.bz2
参数:
-c :将压缩的过程产生的数据输出到屏幕上!
-d :解压缩的参数
-z :压缩的参数
-# :与 gzip 同样的,都是在计算压缩比的参数, -9 最佳, -1 最快!
范例:
范例一:将刚刚的 /tmp/man.config 以 bzip2 压缩
[root@linux tmp]# bzip2 -z man.config 
# 此时 man.config 会变成 man.config.bz2 !
范例二:将范例一的档案内容读出来!
[root@linux tmp]# bzcat man.config.bz2
# 此时屏幕上会显示 man.config.bz2 解压缩之后的档案内容!!
范例三:将范例一的档案解压缩
[root@linux tmp]# bzip2 -d man.config.bz2
范例四:将范例三解开的 man.config 用最佳的压缩比压缩,并保留原本的档案
[root@linux tmp]# bzip2 -9 -c man.config > man.config.bz2

使用 compress 扩展名自动建立为 .Z ,使用 gzip 扩展名自动建立为 .gz 。这里的 bzip2 则是自动的将扩展名建置为 .bz2 啰!所以当我们使用具有压缩功能的 bzip2 -z 时,那么刚刚的 man.config 就会自动的变成了 man.config.bz2 这个档名啰!

好了,那么如果我想要读取这个档案的内容呢? 是否一定要解开?当然不需要啰!可以使用简便的 bzcat 这个指令来读取内容即可!例如上面的例子中, 我们可以使用 bzcat man.config.bz2 来读取数据而不需要解开!此外,当您要解开一个压缩文件时, 这个档案的名称为 .bz, .bz2, .tbz, .tbz2 等等,那么就可以尝试使用 bzip2 来解看看啦!当然啰,也可以使用 bunzip2 这个指令来取代 bzip2 -d 啰。

小标题的图示tar

[root@linux ~]# tar [-cxtzjvfpPN] 档案与目录 ....
参数:
-c :建立一个压缩文件案的参数指令(create 的意思);
-x :解开一个压缩文件案的参数指令! 
-t :查看 tarfile 里面的档案!
 特别注意,在参数的下达中, c/x/t 仅能存在一个!不可同时存在!
 因为不可能同时压缩与解压缩。
-z :是否同时具有 gzip 的属性?亦即是否需要用 gzip 压缩?
-j :是否同时具有 bzip2 的属性?亦即是否需要用 bzip2 压缩?
-v :压缩的过程中显示档案!这个常用,但不建议用在背景执行过程!
-f :使用档名,请留意,在 f 之后要立即接档名喔!不要再加参数!
  例如使用『 tar -zcvfP tfile sfile』就是错误的写法,要写成
  『 tar -zcvPf tfile sfile』才对喔!
-p :使用原档案的原来属性(属性不会依据用户而变) 
-P :可以使用绝对路径来压缩!
-N :比后面接的日期(yyyy/mm/dd)还要新的才会被打包进新建的档案中! 
--exclude FILE:在压缩的过程中,不要将 FILE 打包! 
范例:
范例一:将整个 /etc 目录下的档案全部打包成为 /tmp/etc.tar 
[root@linux ~]# tar -cvf /tmp/etc.tar /etc  <==仅打包,不压缩!
[root@linux ~]# tar -zcvf /tmp/etc.tar.gz /etc  <==打包后,以 gzip 压缩
[root@linux ~]# tar -jcvf /tmp/etc.tar.bz2 /etc  <==打包后,以 bzip2 压缩
# 特别注意,在参数 f 之后的档案档名是自己取的,我们习惯上都用 .tar 来作为辨识。
# 如果加 z 参数,则以 .tar.gz 或 .tgz 来代表 gzip 压缩过的 tar file 〜
# 如果加 j 参数,则以 .tar.bz2 来作为扩展名啊〜
# 上述指令在执行的时候,会显示一个警告讯息:
# 『tar: Removing leading `/' from member names』那是关于绝对路径的特殊设定。
范例二:查阅上述 /tmp/etc.tar.gz 档案内有哪些档案?
[root@linux ~]# tar -ztvf /tmp/etc.tar.gz 
# 由于我们使用 gzip 压缩,所以要查阅该 tar file 内的档案时,
# 就得要加上 z 这个参数了!这很重要的!
范例三:将 /tmp/etc.tar.gz 档案解压缩在 /usr/local/src 底下
[root@linux ~]# cd /usr/local/src
[root@linux src]# tar -zxvf /tmp/etc.tar.gz
# 在预设的情况下,我们可以将压缩文件在任何地方解开的!以这个范例来说,
# 我先将工作目录变换到 /usr/local/src 底下,并且解开 /tmp/etc.tar.gz ,
# 则解开的目录会在 /usr/local/src/etc 呢!另外,如果您进入 /usr/local/src/etc
# 则会发现,该目录下的文件属性与 /etc/ 可能会有所不同喔!
范例四:在 /tmp 底下,我只想要将 /tmp/etc.tar.gz 内的 etc/passwd 解开而已
[root@linux ~]# cd /tmp
[root@linux tmp]# tar -zxvf /tmp/etc.tar.gz etc/passwd
# 我可以透过 tar -ztvf 来查阅 tarfile 内的文件名,如果单只要一个档案,
# 就可以透过这个方式来下达!注意到! etc.tar.gz 内的根目录 / 是被拿掉了!
范例五:将 /etc/ 内的所有文件备份下来,并且保存其权限!
[root@linux ~]# tar -zcvpf /tmp/etc.tar.gz /etc
# 这个 -p 的属性是很重要的,尤其是当您要保留原本档案的属性时!
范例六:在 /home 当中,比 2005年06月01日 新的档案才备份
[root@linux ~]# tar -N '2005/06/01' -zcvf home.tar.gz /home
范例七:我要备份 /home, /etc ,但不要 /home/dmtsai 
[root@linux ~]# tar --exclude /home/dmtsai -zcvf myfile.tar.gz /home/* /etc
范例八:将 /etc/ 打包后直接解开在 /tmp 底下,而不产生档案! 
[root@linux ~]# cd /tmp
[root@linux tmp]# tar -cvf - /etc | tar -xvf -
# 这个动作有点像是 cp -r /etc /tmp 啦〜依旧是有其有用途的!
# 要注意的地方在于输出档变成 - 而输入档也变成 - ,又有一个 | 存在〜
# 这分别代表 standard output, standard input 与管线命令啦!
# 这部分我们会在 Bash shell 时,再次提到这个指令跟大家再解释啰!

这是一个多用途的压缩指令!刚刚我们提到的 compress 与 gzip 是可以适用在一个档案的压缩上面, 但是如果是要将一个目录压缩成一个档案呢?!这时该如何是好?!呵呵! tar 就派上用场了! tar 可以将整个目录或者是指定的档案都整合成一个档案!例如上面的范例一,他可以将 /etc 底下的档案全部整合成一个档案!同时, tar 可以配合 gzip (这个 gzip 的功能已经已经附加上 tar 里面去了) ,同时整合并压缩!呵呵!很方便吧!

『 tar 用来作备份是很重要的指令! 』而由于 tar 整合过后的档案我们通常会取名为 *.tar ,而如果还含有 gzip 的压缩属性,那么就取名为 *.tar.gz 啰!取这个文件名只是为了方便我们记忆这个档案是什么属性罢了!并没有实际的意义在!

绝对路径与权限的问题

另外,需要注意的是,在使用的参数方面,有还有几个有用的参数需要来了解一番,亦即是 -p 与 -P 这两个!在我们的范例一当中,有提到一个警告讯息,那就是『 tar: Removing leading `/' from member names』意思是说, tar 将 /etc 目录的那个 / 拿掉了!这是因为担心未来你在解开压缩的时候,会产生一些困扰, 因为在 tar 里面的档案如果是具有『绝对路径』的话,那么你解开的档案将会『一定』在该路径下也就是 /etc,而不是相对路径 (这里请用心的想一想!) 。

这样子的最大困扰是,万一有人拿走了你的这个档案,并且将该档案在他的系统上面解开!万一他的系统上面正巧也有 /etc 这个目录 (那当然是一定有的啊!),哈哈!他的档案就会『正巧』被覆盖了! 所以啰,在预设的情况中,如果是以『绝对路径』来建立打包档案,那么 tar 将会自动的将 / 拿掉!这是为了刚刚说明的『安全』为前提所做的默认值。好了!但是你就是要以绝对路径来建立打包的档案!那么就加入 -P 这个参数吧 (请注意!是大写字符) !这样就可以啦!

那么 -p 是什么 (小写字符) ?呵呵!那个 -p 是 permission 的意思,也就是『权限』啦!使用 -p 之后,被打包的档案将不会依据使用者的身份来改变权限喔!

关于档案的更新日期:

这里还有一个值得注意的参数呦!那就是在备份的情况中很常使用的 -N 的这个参数! 你可以参考一下上面的例子就可以知道啦!在这个例子当中,相当重要的就是那个日期啦! 在备份的情况当中,我们都希望只要备份较新的档案就好了,为什么呢?因为旧的档案我们已经有备份啰! 干嘛还要再备份一次,浪费时间也浪费系统资源!这个时候此一参数就显的相当的重要了啊!

关于 standard input/standard output:

在上面的例子中,最后一个例子很有趣『tar cvf - /etc | tar -xvf - 』!他是直接以管线命令『 pipe 』来进行压缩、解压缩的过程!在上面的例子中,我们想要『将 /etc 底下的数据直接 copy 到目前所在的路径,也就是 /tmp 底下来』,但是又觉得使用 cp -r 有点麻烦,那么就直接以这个打包的方式来打包,其中,指令里面的 - 就是表示那个被打包的档案啦!由于我们不想要让中间档案存在,所以就以这一个方式来进行复制的行为啦!

什么是 tarfile 与 tarball?

tar 的功能相当的多,而由于他是经由『打包』之后再处理的一个过程,所以常常我们会听到 tarball 的档案,那就是经由 tar 打包再压缩的档案啦! 而如果仅是打包而没有压缩的话,我们就称为 tarfile 啰〜此外, tar 也可以用在备份的储存媒体上面,最常见的就是磁带机了!假设我的磁带机代号为 /dev/st0 ,那么我要将我的 /home 底下的数据都给他备份上去时,就是使用 tar /dev/st0 /home 就可以啦!很不错吧!

在 Linux 当中, gzip 已经被整合在 tar 里面了!但是 Sun 或者其他较旧的 Unix 版本中, 当中的 tar 并没有整合 gzip ,所以如果你需要解压缩的话,就需要这么做:

第一个步骤会将档案解压缩,第二个步骤才是将数据解出来!与其他压缩程序不太一样的是, bzip2, gzip 与 compress 在没有加入特殊参数的时候,原先的档案会被取代掉,但是使用 tar 则原来的与后来的档案都会存在呦!

小标题的图示dd

我们在上一章当中,在制作出 swap file 时,使用过 dd 这个指令对吧?! 不过,这个指令可不只是制作一个档案而已喔〜这个 dd 指令最大的功效,鸟哥认为,应该是在于『备份』啊! 因为 dd 可以读取装置的内容,然后将整个装置备份成一个档案呢!真的是相当的好用啊〜 dd 的用途有很多啦〜但是我们仅讲一些比较重要的参数,如下:

[root@linux ~]# dd if="input_file" of="output_file" bs="block_size" \
count="number"
参数:
if :就是 input file 啰〜也可以是装置喔!
of :就是 output file 喔〜也可以是装置;
bs :规划的一个 block 的大小,如果没有设定时,预设是 512 bytes
count:多少个 bs 的意思。
范例:
范例一:将 /etc/passwd 备份到 /tmp/passwd.back 当中
[root@linux ~]# dd if=/etc/passwd of=/tmp/passwd.back
3+1 records in
3+1 records out
[root@linux ~]# ll /etc/passwd /tmp/passwd.back
-rw-r--r-- 1 root root 1746 Aug 25 14:16 /etc/passwd
-rw-r--r-- 1 root root 1746 Aug 29 16:57 /tmp/passwd.back
# 仔细的看一下,我的 /etc/passwd 档案大小为 1746 bytes,因为我没有设定 bs ,
# 所以默认是 512 bytes 为一个单位,因此,上面那个 3+1 表示有 3 个完整的 
# 512 bytes,以及未满 512 bytes 的另一个 block 的意思啦!
# 事实上,感觉好像是 cp 这个指令啦〜
范例二:备份 /dev/hda 的 MBR 
[root@linux ~]# dd if=/dev/hda of=/tmp/mbr.back bs=512 count=1
1+0 records in
1+0 records out
# 这就得好好了解一下啰〜我们知道整颗硬盘的 MBR 为 512 bytes,
# 就是放在硬盘的第一个 sector 啦,因此,我可以利用这个方式来将
# MBR 内的所有数据都纪录下来,真的很厉害吧! ^_^
范例三:将整个 /dev/hda1 partition 备份下来。
[root@linux ~]# dd if=/dev/hda1 of=/some/path/filename
# 这个指令很厉害啊!将整个 partition 的内容全部备份下来〜
# 后面接的 of 必须要不是在 /dev/hda1 的目录内啊〜否则,怎么读也读不完〜
# 这个动作是很有效用的,如果改天你必须要完整的将整个 partition 的内容填回去,
# 则可以利用 dd if=/some/file of=/dev/hda1 来将数据写入到硬盘当中。
# 如果想要整个硬盘备份的话,就类似 Norton 的 ghost 软件一般,
# 由 disk 到 disk ,嘿嘿〜利用 dd 就可以啦〜厉害厉害!

你可以说, tar 可以用来备份关键数据,而 dd 则可以用来备份整颗 partition 或整颗 disk ,很不错啊〜不过,如果要将数据填回到 filesystem 当中, 可能需要考虑到原本的 filesystem 才能成功啊!

小标题的图示cpio

这个指令可有趣了!他是透过数据流重导向的方法来将档案进行输出/输入的一个方式〜因为我们尚未提到数据流重导向,所以,您可以先略过这的指令的练习。等到后续的章节读完后, 再来这个章节瞧一瞧!

[root@linux ~]# cpio -covB > [file|device] <==备份
[root@linux ~]# cpio -icduv < [file|device] <==还原
参数:
-o :将数据 copy 输出到档案或装置上 
-i :将数据自档案或装置 copy 出来系统当中 
-t :查看 cpio 建立的档案或装置的内容 
-c :一种较新的 portable format 方式储存 
-v :让储存的过程中文件名可以在屏幕上显示 
-B :让预设的 Blocks 可以增加至 5120 bytes ,预设是 512 bytes ! 
  这样的好处是可以让大档案的储存速度加快(请参考 i-nodes 的观念) 
-d :自动建立目录!由于 cpio 的内容可能不是在同一个目录内,
 如此的话在反备份的过程会有问题! 这个时候加上 -d 的话,
 就可以自动的将需要的目录建立起来了! 
-u :自动的将较新的档案覆盖较旧的档案!
范例:
范例一:将所有系统上的数据通通写入磁带机内!
[root@linux ~]# find / -print | cpio -covB > /dev/st0
# 一般来说,使用 SCSI 接口的磁带机,代号是 /dev/st0 喔!
范例二:检查磁带机上面有什么档案?
[root@linux ~]# cpio -icdvt < /dev/st0
[root@linux ~]# cpio -icdvt < /dev/st0 > /tmp/content
# 第一个动作当中,会将磁带机内的文件名列出到屏幕上面,而我们可以透过第二个动作,
# 将所有的文件名通通纪录到 /tmp/content 档案去!
范例三:将磁带上的数据还原回来〜
[root@linux ~]# cpio -icduv < /dev/st0
# 一般来说,使用 SCSI 接口的磁带机,代号是 /dev/st0 喔!
范例四:将 /etc 底下的所有『档案』都备份到 /root/etc.cpio 中!
[root@linux ~]# find /etc -type f | cpio -o > /root/etc.cpio
# 这样就能够备份啰〜您也可以将数据以 cpio -i < /root/etc.cpio 
# 来将资料捉出来!!!!

这个 cpio 还蛮神奇的呢!他最适用于备份的时候使用的一个指令了!为什么呢?因为他并不像 cp 一样,可以直接的将档案给他 copy 过去,例如 cp * /tmp 就可以将所在目录的所有档案 copy 到 /tmp 底下,在 cpio 这个指令的用法中,由于 cpio 无法直接读取档案, 而是需要『每一个档案或目录的路径连同文件名一起』才可以被记录下来!因此, cpio 最常跟 find 这个指令一起使用了!

这个 cpio 好像不怎么好用呦!但是,嘿嘿!他可是备份的时候的一项利器呢!因为他可以备份任何的档案, 包括 /dev 底下的任何装置档案!呵呵!所以他可是相当重要的呢!!您说是吧! 而由于 cpio 必需要配合其他的程序,例如 find 来建立档名,所以, cpio 与管线命令及数据流重导向的相关性就相当的重要了!

2003年02月09日:第一次完成
2003年05月05日:修改 tar 的部分内容,尤其是 -P 这个参数的配合用法
2005年07月26日:将旧有的文章移动到这里
2005年07月27日:大略修改了一些风格,另外,动作较大的是在范例的部分!
2005年08月29日:加入了 dd 这个有趣的指令喔!
2006年05月02日:将原本『tar -zxvpf /tmp/etc.tar.gz /etc』修改为『tar -zcvpf /tmp/etc.tar.gz /etc』感谢讨论区网友 chinu 提供的信息。

http://linux.vbird.org is designed by VBird during 2001-2011. ksu.edu

本网页主要以Firefox配合解析度 1024x768 作为设计依据鸟哥自由软件整合应用研究室