14. Bash 模式扩展

1.简介

Shell 接收到用户输入的命令以后,会根据空格将用户的输入,拆分成一个个词元(token)。然后,Shell 会扩展词元里面的特殊字符,扩展完成后才会调用相应的命令。

这种特殊字符的扩展,称为模式扩展(globbing)。其中有些用到通配符,又称为通配符扩展(wildcard expansion)。Bash 一共提供八种扩展。

  • 波浪线扩展
  • ? 字符扩展
  • * 字符扩展
  • 方括号扩展
  • 大括号扩展
  • 变量扩展
  • 子命令扩展
  • 算术扩展

本章介绍这八种扩展。

Bash 是先进行扩展,再执行命令。因此,扩展的结果是由 Bash 负责的,与所要执行的命令无关。命令本身并不存在参数扩展,收到什么参数就原样执行。这一点务必需要记住。

模块扩展的英文单词是globbing,这个词来自于早期的 Unix 系统有一个/etc/glob文件,保存扩展的模板。后来 Bash 内置了这个功能,但是这个名字就保留了下来。

模式扩展与正则表达式的关系是,模式扩展早于正则表达式出现,可以看作是原始的正则表达式。它的功能没有正则那么强大灵活,但是优点是简单和方便。

Bash 允许用户关闭扩展。

set -o noglob
# 或者
set -f

下面的命令可以重新打开扩展。

set +o noglob
# 或者
set +f

2.波浪线扩展

波浪线~会自动扩展成当前用户的主目录。

echo ~

~/dir表示扩展成主目录的某个子目录,dir是主目录里面的一个子目录名。

echo ~/foo

~user表示扩展成用户user的主目录。

echo ~foo
echo ~root

上面例子中,Bash 会根据波浪号后面的用户名,返回该用户的主目录。

如果~useruser是不存在的用户名,则波浪号扩展不起作用。

echo ~nonExistedUser

~+会扩展成当前所在的目录,等同于pwd命令。

echo ~+

整体效果如下:

image.png

3. ? 字符扩展

?字符代表文件路径里面的任意单个字符,不包括空字符。比如,Data???匹配所有Data后面跟着三个字符的文件名。

# 匹配 a.txt 和 b.txt 这样的文件
ls ?.txt

上面命令中,?表示单个字符,所以会同时匹配a.txtb.txt

如果匹配多个字符,就需要多个?连用。

# 匹配 ab.txt
ls ??.txt

上面命令中,??匹配了两个字符。

? 字符扩展属于文件名扩展,只有文件确实存在的前提下,才会发生扩展。如果文件不存在,扩展就不会发生。

4. * 字符扩展

*字符代表文件路径里面的任意数量的任意字符,包括零个字符,这和正则表达式中的*符号一个效果。

# 匹配任意以.txt结尾的文件
ls *.txt

上面例子中,*.txt代表后缀名为.txt的所有文件。

如果想输出当前目录的所有文件,直接用*即可。

ls *

注意,*不会匹配隐藏文件(以.开头的文件),即ls *不会输出隐藏文件。

如果要匹配隐藏文件,需要写成.*

# 显示所有隐藏文件
echo .*

如果要匹配隐藏文件,同时要排除...这两个特殊的隐藏文件,可以与方括号扩展结合使用,写成.[!.]*

echo .[!.]*

注意,*字符扩展属于文件名扩展,只有文件确实存在的前提下才会扩展。如果文件不存在,就会原样输出。

*只匹配当前目录,不会匹配子目录。

# 子目录有一个 a.txt
# 无效的写法
ls *.txt

# 有效的写法
ls */*.txt

上面的例子,文本文件在子目录,*.txt不会产生匹配,必须写成*/*.txt。有几层子目录,就必须写几层星号。

Bash 4.0 引入了一个参数globstar,当该参数打开时,允许**匹配零个或多个子目录。因此,**/*.txt可以匹配顶层的文本文件和任意深度子目录的文本文件。详细介绍请看后面shopt命令的介绍。

5.方括号扩展

方括号扩展的形式是[...],只有文件确实存在的前提下才会扩展。如果文件不存在,就会原样输出。括号之中的任意一个字符。

比如,[aeiou]可以匹配五个元音字母中的任意一个,效果与正则表达式中的[]是一样的。

# 匹配a.txt 或 b.txt
ls [ab].txt

上面例子中,[ab]可以匹配ab,前提是确实存在相应的文件。

方括号扩展属于文件名匹配,即扩展后的结果必须符合现有的文件路径。如果不存在匹配,就会保持原样,不进行扩展,这个和前面所说的保持一致,只要匹配不上,就不会进行扩展。

方括号扩展还有两种变体:[^...][!...]。它们表示匹配不在方括号里面的字符,这两种写法是等价的。比如,[^abc][!abc]表示匹配除了abc以外的字符。

ls ?[!a]?

上面命令中,[!a]表示文件名第二个字符不是a的文件名。

注意,如果需要匹配[字符,可以放在方括号内,比如[[aeiou]。如果需要匹配连字号-,只能放在方括号内部的开头或结尾,比如[-aeiou][aeiou-]

6. start-end 扩展

方括号扩展有一个简写形式[start-end],表示匹配一个连续的范围。比如,[a-c]等同于[abc][0-9]匹配[0123456789]

# 匹配a.txt,b.txt,c.txt
ls [a-c].txt

# 匹配以数字0-9结尾的report文本文件
$ ls report[0-9].txt

下面是一些常用简写的例子。

  • [a-z]:所有小写字母。
  • [a-zA-Z]:所有小写字母与大写字母。
  • [a-zA-Z0-9]:所有小写字母、大写字母与数字。
  • [abc]*:所有以abc字符之一开头的文件名。
  • program.[co]:文件program.c与文件program.o
  • BACKUP.[0-9][0-9][0-9]:所有以BACKUP.开头,后面是三个数字的文件名。

这种简写形式有一个否定形式[!start-end],表示匹配不属于这个范围的字符。比如,[!a-zA-Z]表示匹配非英文字母的字符。

ls report[!1–3].txt

上面代码中,[!1-3]表示排除1、2和3。

7.大括号扩展

大括号扩展{...}表示分别扩展成大括号里面的所有值,各个值之间使用逗号分隔。比如,{1,2,3}扩展成1 2 3

echo {1,2,3}
echo d{a,e,i,u,o}g
echo Front-{A,B,C}-Back

效果:

image.png

注意,大括号扩展不是文件名扩展。它会扩展成所有给定的值,而不管是否有对应的文件存在。

ls {a,b,c}.txt

上面例子中,即使不存在对应的文件,{a,b,c}依然扩展成三个文件名,导致ls命令报了三个错误:

image.png

另一个需要注意的地方是,大括号内部的逗号前后不能有空格。否则,大括号扩展会失效。

echo {1 , 2}

上面例子中,逗号前后有空格,Bash 就会认为这不是大括号扩展,而是三个独立的参数:

image.png

逗号前面可以没有值,表示扩展的第一项为空。

cp a.log{,.bak}

# 等同于
cp a.log a.log.bak

大括号可以嵌套。

echo {j{p,pe}g,png}
jpg jpeg png

echo a{A{1,2},B{3,4}}b
aA1b aA2b aB3b aB4b

大括号也可以与其他模式联用,并且总是先于其他模式进行扩展。

echo /bin/{cat,b*}
/bin/cat /bin/b2sum /bin/base32 /bin/base64 ... ...

# 基本等同于
echo /bin/cat;echo /bin/b*

上面例子中,会先进行大括号扩展,然后进行*扩展,等同于执行两条echo命令。

大括号可以用于多字符的模式,方括号不行(只能匹配单字符)。

echo {cat,dog}