linux常用命令diff
Linux diff (diff 即 different 简写)命令用于比较文件的差异。
diff 以逐行的方式,比较文本文件的异同处。如果指定要比较目录,则diff会比较目录中相同文件名的文件,但不会比较其中子目录
diff file_1 file_2 diff 就会告诉你,这两个文件有何差异。它的显示结果不太好懂,下面我就来说明,如何读懂diff。
参数:
-<行数>:指定要显示多少行的文本。此参数必须与-c或-u参数一并使用; -a或--text:diff预设只会逐行比较文本文件; -b或--ignore-space-change:不检查空格字符的不同; -B或--ignore-blank-lines:不检查空白行; -c:显示全部内容,并标出不同之处; -C<行数>或--context<行数>:与执行“-c-<行数>”指令相同; -d或--minimal:使用不同的演算法,以小的单位来做比较; -D<巨集名称>或ifdef<巨集名称>:此参数的输出格式可用于前置处理器巨集; -e或--ed:此参数的输出格式可用于ed的script文件; -f或-forward-ed:输出的格式类似ed的script文件,但按照原来文件的顺序来显示不同处; -H或--speed-large-files:比较大文件时,可加快速度; -l<字符或字符串>或--ignore-matching-lines<字符或字符串>:若两个文件在某几行有所不同,而之际航同时都包含了选项中指定的字符或字符串,则不显示这两个文件的差异; -i或--ignore-case:不检查大小写的不同; -l或--paginate:将结果交由pr程序来分页; -n或--rcs:将比较结果以RCS的格式来显示; -N或--new-file:在比较目录时,若文件A仅出现在某个目录中,预设会显示:Only in目录,文件A 若使用-N参数,则diff会将文件A 与一个空白的文件比较; -p:若比较的文件为C语言的程序码文件时,显示差异所在的函数名称; -P或--unidirectional-new-file:与-N类似,但只有当第二个目录包含了第一个目录所没有的文件时,才会将这个文件与空白的文件做比较; -q或--brief:仅显示有无差异,不显示详细的信息; -r或--recursive:比较子目录中的文件; -s或--report-identical-files:若没有发现任何差异,仍然显示信息; -S<文件>或--starting-file<文件>:在比较目录时,从指定的文件开始比较; -t或--expand-tabs:在输出时,将tab字符展开; -T或--initial-tab:在每行前面加上tab字符以便对齐; -u,-U<列数>或--unified=<列数>:以合并的方式来显示文件内容的不同; -v或--version:显示版本信息; -w或--ignore-all-space:忽略全部的空格字符; -W<宽度>或--width<宽度>:在使用-y参数时,指定栏宽; -x<文件名或目录>或--exclude<文件名或目录>:不比较选项中所指定的文件或目录; -X<文件>或--exclude-from<文件>;您可以将文件或目录类型存成文本文件,然后在=<文件>中指定此文本文件; -y或--side-by-side:以并列的方式显示文件的异同之处; --help:显示帮助; --left-column:在使用-y参数时,若两个文件某一行内容相同,则仅在左侧的栏位显示该行内容; --suppress-common-lines:在使用-y参数时,仅显示不同之处。
diff 的 三种格式
由于历史原因,diff 有三种格式:
正常格式(normal diff) 上下文格式(context diff) 合并格式(unified diff) 我们依次来看。
示例文件
为了便于讲解,先新建两个示例文件。
第一个文件叫做 f1,内容是每行一个 a,一共 7 行。
a a a a a a a 第二个文件叫做 f2,修改 f1 而成,第 4 行变成 hello,其他不变
a a a hello a a a
正常格式的 diff
diff命令的Normal模式,这也是diff命令的默认模式,也就是说diff两个文件的时候如果不加模式参数则是默认模式进行比较,其效果与(--normal)一样,我们举一些例子来说明Normal模式下的输出结果(前面已经说明了一种比较结果),为了直观查看两个文件的不同我在windows下面通过BeyondCompare工具列出两个文件的不同,而截图下面的黑色部分则是diff的比较输出截图。
第一个文件比第二个文件少了行的情况:
第一个文件比第二个文件多出行的情况:
第一个文件与第二个文件不相同的情况:
以上 diff 命令执行的时候没有指定额外的模式参数,所以其使用的是默认的 Normal 模式,效果与添加命令行参数 --normal 是一样的。
使用示例分析
现在对 f1 和 f2 进行比较:$ diff f1 f2
这时,diff 就会显示正常格式的结果:
4c4 < a --- > hello 第一行:4c4 是一个提示,用来说明变动位置。4c4 分成 三个部分:前面的"4",表示 f1 的第 4 行有变化;中间的 "c" 表示变动的模式是内容改变(change),其他模式还有"增加"(a,代表addition)和"删除"(d,代表deletion);后面的"4",表示变动后变成 f2 的第 4 行。 第二行:< a 分成两个部分。< a:前面的 小于号,表示要从 f1 当中去除该行(也就是第 4 行),后面的 "a" 表示该行的内容。 第三行:--- 用来分割 f1 和 f2。 第四行:> b 类似于第二行。> b :前面的 大于号 表示 f2 增加了该行,后面的 "hello" 表示该行的内容。最早的Unix(即AT&T版本的Unix),使用的就是这种格式的diff。
上下文格式的 diff :Context 模式
上个世纪80年代初,加州大学伯克利分校推出 BSD版本的 Unix 时,觉得 diff 的显示结果太简单,最好加入上下文,便于了解发生的变动。因此,推出了上下文格式的 diff。
默认情况下的模式输出结果实际上是符合计算机的思维方式,不太直观,所以其输出结果并不能够很好的被人理解,diff命令除了默认模式之外还提供了另外两种模式,Context 和 Unified 模式。
diff 命令应用 Context 模式只需要添加命令行参数 diff -c 即可,我们先看看两个案例文件:
接下来说明这两个文件以diff -c 方式比较的结果:
使用示例分析 上下文模式 使用方法加入 c 参数(代表context):$ diff -c f1 f2
显示结果如下:
$ diff -c f1 f2 * f1 2019-05-20 14:22:15.111801433 +0800 --- f2 2019-05-20 14:22:27.401207382 +0800 * * 1,7 a a a ! a a a a --- 1,7 ---- a a a ! hello a a a
这个结果分成四个部分。
第一部分的两行,显示两个文件的基本情况:文件名和时间信息。 * f1 2019-05-20 14:22:15.111801433 +0800 --- f2 2019-05-20 14:22:27.401207382 +0800 提示:"*" 表示变动前的文件,"---" 表示变动后的文件。 第二部分是15个星号,将文件的基本情况与变动内容分割开。 * 第三部分显示变动前的文件,即 f1。 * 1,7 a a a !a a a a
这时不仅显示发生变化的第 4 行,还显示第 4 行的前面三行和后面三行,因此一共显示7行。所以,前面的"* 1,7 "就表示,从第 1 行开始连续 7 行。
另外,文件内容的每一行最前面,还有一个标记位。如果为空,表示该行无变化; 如果是感叹号(!),表示该行有改动; 如果是减号(-),表示该行被删除; 如果是加号(+),表示该行为新增。
第四部分显示变动后的文件,即f2。 --- 1,7 ---- a a a !hello a a a 除了变动行(第4行)以外,也是上下文各显示三行,总共显示7行。
合并格式的 diff:也即 Unified 模式 如果两个文件相似度很高,那么上下文格式的 diff,将显示大量重复的内容,很浪费空间。1990年,GNU diff 率先推出了"合并格式"的 diff,将 f1 和 f2 的上下文合并在一起显示。
diff 还有一种比较方式,也即 Unified 模式,使用命令行 –u 来执行该模式的比较。其比较结果与Context模式很像,但是简化了一些输出,我们看看我们的案例文件,与上面的一样:
使用diff –u 比较的结果:
可以看到其比较结果与Context模式实际上差不多,只不过将比较结果合并到一起了
使用示例分析 加入u参数(代表unified):$ diff -u f1 f2
显示结果如下:
$ diff -u f1 f2 --- f1 2019-05-20 14:22:15.111801433 +0800 +++ f2 2019-05-20 14:22:27.401207382 +0800 @@ -1,7 +1,7 @@ a a a -a +hello a a a 第一部分,也是文件的基本信息。 --- f1 2019-05-20 14:22:15.111801433 +0800 +++ f2 2019-05-20 14:22:27.401207382 +0800 "---"表示变动前的文件,"+++"表示变动后的文件。
第二部分,变动的位置用两个@作为起首和结束。 @@ -1,7 +1,7 @@ 前面的"-1,7"分成三个部分:减号表示第一个文件(即f1),"1"表示第1行,"7"表示连续7行。合在一起,就表示下面是第一个文件从第1行开始的连续7行。 同样的,"+1,7"表示变动后,成为第二个文件从第1行开始的连续7行。
第三部分,是变动的具体内容。 a a a -a +hello a a a
除了有变动的那些行以外,也是上下文各显示3行。它将两个文件的上下文,合并显示在一起,所以叫做"合并格式"。 每一行最前面的标志位,空表示无变动,减号表示第一个文件删除的行,加号表示第二个文件新增的行。
git 格式的 diff
版本管理系统git,使用的是合并格式 diff 的变体:$ git diff
显示结果如下:
diff --git a/f1 b/f1 index 6f8a38c..3235643 100644 --- a/f1 +++ b/f1 @@ -1,7 +1,7 @@ a a a -a +hello a a a 第一行 表示结果为 git 格式的diff。 diff --git a/f1 b/f1 进行比较的是,a版本的f1(即变动前)和b版本的f1(即变动后)。
第二行 表示两个版本的 git 哈希值(index区域的6f8a38c对象,与工作目录区域的449b072对象进行比较),最后的六位数字是对象的模式(普通文件,644权限)。 index 6f8a38c..449b072 100644
第三行 表示进行比较的两个文件。 --- a/f1 +++ b/f1
"---"表示变动前的版本,"+++"表示变动后的版本。
后面的行都与官方的合并格式diff相同。
@@ -1,7 +1,7 @@ a a a -a +hello a a a
比较目录
使用diff可以比较两个目录,其比较格式是 diff directory1 directory2 查看如下目录比较结果:
比较两个目录的时候无非是有的文件仅仅存在于某个目录中而在另一个目录中没有,如果存在同名的文件,则比较这两个文件的不同。diff比较目录的结果我们可以结合grep命令筛选出我们想要的输出,例如仅仅输出两个目录下不同的文件而忽略掉某一个目录独有另一个目录不存在的输出记录
实例1:比较两个文件
[root@localhost test3]# diff log2014.log log2013.log 3c3 < 2014-03 --- > 2013-03 8c8 < 2013-07 --- > 2013-08 11,12d10 < 2013-11 < 2013-12 上面的"3c3"和"8c8"表示log2014.log和log20143log文件在3行和第8行内容有所不同;"11,12d10"表示第一个文件比第二个文件多了第11和12行。
实例2:并排格式输出
[root@localhost test3]# diff log2014.log log2013.log -y -W 50 2013-01 2013-01 2013-02 2013-02 2014-03 | 2013-03 2013-04 2013-04 2013-05 2013-05 2013-06 2013-06 2013-07 2013-07 2013-07 | 2013-08 2013-09 2013-09 2013-10 2013-10 2013-11 < 2013-12 < [root@localhost test3]# diff log2013.log log2014.log -y -W 50 2013-01 2013-01 2013-02 2013-02 2013-03 | 2014-03 2013-04 2013-04 2013-05 2013-05 2013-06 2013-06 2013-07 2013-07 2013-08 | 2013-07 2013-09 2013-09 2013-10 2013-10 > 2013-11 > 2013-12 说明:
"|"表示前后2个文件内容有不同 "<"表示后面文件比前面文件少了1行内容 ">"表示后面文件比前面文件多了1行内容