unix上的diff-wc帮助
我使用unix上的diff-wc帮助,unix,diff,Unix,Diff,我使用diff-y比较了两个文件file1和file2。当我对diff文件执行wc-l时,我得到了66000的值。之前,我将同一个文件1和文件2连接起来用于其他内容,并对其执行了wc-l。我一共有84000行 当我对diff文件和连接的文件执行wc-l时,行数不应该相同吗?我在diff文件中遗漏了什么吗 我还计算了两个文件之间有多少内容不同,有多少内容相同,有多少内容只出现在一个文件和另一个文件中,然后将它们相加,总数为66000 当我连接时,我做到了 sort | uniq | wc -l
diff-y
比较了两个文件file1和file2。当我对diff文件执行wc-l
时,我得到了66000的值。之前,我将同一个文件1和文件2连接起来用于其他内容,并对其执行了wc-l
。我一共有84000行
当我对diff文件和连接的文件执行wc-l
时,行数不应该相同吗?我在diff文件中遗漏了什么吗
我还计算了两个文件之间有多少内容不同,有多少内容相同,有多少内容只出现在一个文件和另一个文件中,然后将它们相加,总数为66000
当我连接时,我做到了
sort | uniq | wc -l
当我不同意的时候,我只是做了一个
wc -l
但是,文件已经是不同的
sort
ed和uniq
ed文件。不知道我错过了什么 由于diff-y
显示“已更改”和“已移动”行的方式,因此显示的行数diff-y
与通过组合原始文件并通过排序和uniq(ue)过滤显示的行数之间可能没有关系
这里我们有两个排序文件,分别有20行和19行。两个文件的Sort+uniq一起显示32行,而diff只显示20行:
| file1+2 |
| sort | diff -y -W 12
file1| file2 | uniq | file1 file2
-----|-------|---------|---------------
act act act act act
all all all all all
and and and and and
bar can bar bar | can
boy car boy boy | car
but cat but but | cat
dad dad can dad dad
day eat car day | eat
did eel cat did | eel
dip egg dad dip | egg
far get day far | get
fir gum did fir | gum
for gym dip for | gym
hat ill eat hat | ill
him ink eel him | ink
hip its egg hip | its
how zap far how <
zap zip fir zap zap
zip zoo for zip zip
zoo get zoo zoo
gum
gym
hat
him
hip
how
ill
ink
its
zap
zip
zoo
-----|-------|---------|---------------
20 | 19 | 32 | 20
|文件1+2|
|排序|差异-y-W 12
文件1 |文件2 | uniq |文件1文件2
-----|-------|---------|---------------
行动
全部
及及
棒罐棒|罐
男孩车男孩车
但是猫但是|猫
爸爸,爸爸,爸爸,爸爸
一天吃汽车一天|吃
鳗鱼猫是鳗鱼吗
蘸鸡蛋爸爸蘸鸡蛋
天长地久
冷杉树胶没有冷杉树胶
为| gym的健身房浸泡
帽子坏了吃帽子
给他墨水,给他墨水
屁股它的蛋屁股|它的
多远,多远<
扎普拉链冷杉扎普扎普
拉链动物园
动物园
口香糖
健身房
帽子
他
臀部
怎样
生病的
墨水
它的
扎普
拉链
动物园
-----|-------|---------|---------------
20 | 19 | 32 | 20
这里我们有2个排序文件,每个文件有19行。两个文件的Sort+uniq一起显示31行,diff也显示31行:
| file1+2 |
| sort | diff -y -W 12
file1| file2 | uniq | file1 file2
-----|-------|---------|---------------
act act act act act
all all all all all
and and and and and
fad bar bar > bar
far boy boy > boy
fir but but > but
for can can > can
get car car > car
gum cat cat > cat
gym dad dad > dad
hat day day > day
him did did > did
hip eat eat > eat
ill eel eel > eel
ink egg egg > egg
its fad fad fad fad
zap zap far far <
zip zip fir fir <
zoo zoo for for <
get get <
gum gum <
gym gym <
hat hat <
him him <
hip hip <
ill ill <
ink ink <
its its <
zap zap zap
zip zip zip
zoo zoo zoo
-----|-------|---------|---------------
19 | 19 | 31 | 31
|文件1+2|
|排序|差异-y-W 12
文件1 |文件2 | uniq |文件1文件2
-----|-------|---------|---------------
行动
全部
及及
时尚栏>时尚栏
远男孩>男孩
冷杉但是>但是
对于can>can
获取汽车>汽车
口香糖猫>猫
健身房爸爸>爸爸
帽日>日
他做了
臀部吃>吃
鳗鱼>鳗鱼
墨水鸡蛋>鸡蛋
它的时尚
扎普扎普远<
拉链冷杉<
动物园<
得到<
口香糖<
健身房<
帽子<
他<
臀部<
生病<
墨水<
它的<
砰,砰,砰
拉链
动物园
-----|-------|---------|---------------
19 | 19 | 31 | 31
这里我们有两个文件,每个文件有31行。两个文件的Sort+uniq同时显示31行,而diff显示43行:
| file1+2 |
| sort | diff -y -W 12
file1| file2 | uniq | file1 file2
-----|-------|---------|---------------
act act act act act
all all all all all
and and and and and
bar far bar bar <
boy fir boy boy <
but for but but <
can get can can <
car gum car car <
cat gym cat cat <
dad hat dad dad <
day him day day <
did hip did did <
eat how eat eat <
eel ill eel eel <
egg ink egg egg <
far its far far far
fir bar fir fir fir
for boy for for for
get but get get get
gum can gum gum gum
gym car gym gym gym
hat cat hat hat hat
him dad him him him
hip day hip hip hip
how did how how how
ill eat ill ill ill
ink eel ink ink ink
its egg its its its
zap zap zap > bar
zip zip zip > boy
zoo zoo zoo > but
> can
> car
> cat
> dad
> day
> did
> eat
> eel
> egg
zap zap
zip zip
zoo zoo
-----|-------|---------|---------------
31 | 31 | 31 | 43
|文件1+2|
|排序|差异-y-W 12
文件1 |文件2 | uniq |文件1文件2
-----|-------|---------|---------------
行动
全部
及及
远杆<
男孩冷杉男孩<
但是为了但是<
能得到罐头<
汽车胶汽车<
猫健身房猫<
爸爸帽子爸爸爸爸<
日复一日地折磨他<
hip做了吗<
吃怎么吃<
鳗鱼病鳗鱼<
鸡蛋墨水鸡蛋<
太远了,太远了
冷杉杆冷杉
为了男孩
得到,但是得到
口香糖可以使口香糖变硬
健身车健身房
帽子猫帽子
他,爸爸,他
嘻嘻嘻嘻嘻嘻
你是怎么做到的
我吃得不好
墨水鳗鱼墨水
它的蛋它的
zap zap zap>bar
男孩
动物园>但是
>能
>汽车
>猫
>爸爸
>一天
>做过
>吃
>鳗鱼
>蛋
扎普扎普
拉链
动物园
-----|-------|------