上一篇文章参见Bash Pitfalls: 编程易犯的错误(二)

24. for arg in $*

和大多数 Shell 一样,Bash 支持依次读取单个命令行参数的语法。不过这并是$*或者$@,这两种写法都不正确,它们只能得到完整的参数列表,并非单独的一个个参数。

正确的语法是(没错要加上引号):

for arg in "$@"

# 或者更简单的写法
for arg

在脚本中遍历所有参数是一个再普遍不过的需求,所以 for arg 默认等价于 for arg in "$@"。$@使用双引号后就有特殊的魔力,每个参数展开后成为一个独立的单词。("$@"等价于"$1" "$2" "$3" ...)

下面是一个错误的例子:

for x in $*; do
   echo "parameter: '$x'"
done

执行的结果为:

$ ./myscript 'arg 1' arg2 arg3
parameter: 'arg'
parameter: '1'
parameter: 'arg2'
parameter: 'arg3'

正确的写法:

for x in "$@"; do
   echo "parameter: '$x'"
done

执行的结果为:

$ ./myscript 'arg 1' arg2 arg3
parameter: 'arg 1'
parameter: 'arg2'
parameter: 'arg3'

上面正确的例子中,第一个参数'arg 1'在展开后依然是一个独立的单词,而不会被拆分成两个。

25. function foo()

这种写法不一定能够兼容所有 shell,兼容的写法是:

foo() {
  ...
}

26. echo "~"

波浪号展开(Tilde expansion)仅当~没有引号的时候发生,在上面的例子中,只会向标准输出打印~符号,而不是当前用户的家目录路径。

当用引号将路径参数引起来时,
如果要用引号将相对于家目录的路径引起来时,推荐使用 $HOME 而不是 ~, 假如 $HOME 目录是"/home/my photos",路径中包含空格。

下面是几组例子:

"~/dir with spaces" # expands to "~/dir with spaces"
~"/dir with spaces" # expands to "~/dir with spaces"
~/"dir with spaces" # expands to "/home/my photos/dir with spaces"
"$HOME/dir with spaces" # expands to "/home/my photos/dir with spaces"

27. local varname=$(command)

当在函数中声明局部变量时,local作为一个独立的命令,这种奇特的行为有时候可能会导致困扰。比如,当你想要捕获命令替换的返回码时,你就不能这样做。local命令的返回码会覆盖它。

这种情况下,你只能分成两行写:

local varname
varname=$(command)
rc=$?

28. export foo=~/bar

export 与 local 命令一样,并不是赋值语句的一部分。因此,在有些 Shell 下(比如Bash),export foo=~/bar会展开,但是有些(比如 Dash)却不行。

下面是两种比较健壮的写法:

foo=~/bar; export foo    # Right!
export foo="$HOME/bar"   # Right!

29. sed 's/$foo/good bye/'

单引号内部不会展开 $foo变量,在这里可以换成双引号:

foo="hello"; sed "s/$foo/good bye/"

但是要注意,如果你使用了双引号,就需要考虑更多转义的事情,具体可以看Quotes这一页。.

30. tr [A-Z] [a-z]

这里至少有三个问题。第一个问题是, [A-Z] 和 [a-z] 会被 shell 认为是通配符。如果在当前目录下没用文件名为单个字母的文件,这个命令似乎能正确执行,否则会错误地执行,也许你会在周末耗费许多小时来修复这个问题。

第二个问题是,这不是 tr 命令正确的写法,实际上,上面的命令会把[转换成[,将任意大写字符转换成对应的小写字符,将]转换成],所以你根本不需要加上括号,这样第一个问题就可以解决了。

第三个问题是,上面的命令执行结果依赖于当前的 locale,A-Z 或者 a-z 不一定会代表26个 ASCII 字母。实际上,在一些语言环境下,z 位于字母表的中间位置。这个问题的解法,取决于你希望发生的行为是哪一种。

如果你仅希望改变26个英文字母的大小写(强制 locale为 C):

LC_COLLATE=C tr A-Z a-z

如果你希望根据实际的语言环境来转换:

tr '[:upper:]' '[:lower:]'

31. ps ax | grep gedit

这里的根本问题是正在运行的进程名称,本质上是不可靠的。可能会有多个合法的gedit进程,也有可能是别的东西伪装成gedit进程(改变执行命令名称是一件简单的事情 ),更多细节可以看ProcessManagement这一篇文章。

执行以上命令,往往会在结果中包含 grep 进程:

# ps ax | grep gedit
10530 ?        S      6:23 gedit
32118 pts/0    R+     0:00 grep gedit

这个时候,需要过滤多余的结果:

# ps ax | grep -v grep | grep gedit

上面的写法比较丑陋,另外一种方法是:

# ps ax | grep [g]edit

32. printf "$foo"

如果$foo 变量的值中包括\或者%符号,上面命令的执行结果可能会出乎你的意料之外。

下面是正确的写法:

printf %s "$foo"
printf '%s\n' "$foo"

33. for i in {1..$n}

Bash的命令解释器会优先展开大括号,所以这时大括号{}表达式里面看到的是文字上的$n(没有展开)。$n 不是一个数值,所以这里的大括号{}并不会展开成数字列表。可见,这导致很难使用大括号来展开大小只能在运行时才知道的列表。

可以用下面的方法:

for ((i=1; i<=n; i++)); do
...
done

注:之前我也有写过一篇文章来介绍这个问题:Shell生成数字序列

34. if [[ $foo = $bar ]]

在[[内部,当=号右边的值没有用引号引起来,bash 会将它当作模式来匹配,而不是一个简单的字符串。所以,在上面的例子中 ,如果 bar 的值是一个*号,执行的结果永远是 true。

所以,如果你想检查两侧的字符串是否相同,等号右侧的值一定要用引号引起来。

if [[ $foo = "$bar" ]]

如果你确实要执行模式匹配,聪明的做法是取一个更加有意义的变量名(例如$patt),或者加上注释说明。

35. if [[ $foo =~ 'some RE' ]]

同上,如果=~号右侧的值加上引号,它会散失特殊的正则表达式含义,而变成一个普通的字符串。

如果你想使用一个长的或者复杂的正则表达式,避免大量的反斜杠转义,建议把它放在一个变量中:

re='some RE'
if [[ $foo =~ $re ]]

由于篇幅限制,本系列文章会分成多篇文章,最后一篇参见Bash编程易犯的错误(四)