使用带有正则表达式的 sed 查找和替换复杂字符串
处理文本文件时,你经常需要识别和替换一个或多个文件中的文本字符串。
sed
是一个流编辑器。它可以对文件和输入流(如管道)执行基本的文本操作。你可以使用 sed
搜索、查找和替换单词和行,以及插入和删除它们。
支持基本和扩展的 regex
,允许你匹配复杂的模式。在这篇文章中,我们将了解如何使用 sed
查找和替换字符串。我们还将演示如何使用递归搜索和替换。
在 Bash 中使用 sed
查找和替换字符串
sed
有多种版本,每个版本都有其特点。
Linux 发行版默认预装了 GNU sed
,但 Mac OS 使用 BSD 版本。我们将使用 GNU
版本。
该语法用于使用 sed
搜索和替换文本:
sed -e 's/Search_Regex/substitution/g' Filename
在上面使用的语法中,定义如下:
-e
是默认写入标准输出的 sed 输出。该参数指示sed
在当前位置编辑文件。如果定义了扩展名,则会生成替换文件。///
是用作分隔符的字符。尽管大多数人使用斜线 (/
) 字符,但它可以是任何字符。Search_Regex
是一个搜索的东西。我们将使用regex
或常规字符串。substitution
用作要替换的字符串。g
是全局替换的标志。sed
默认逐行读取文件,并且仅更改每行中第一次出现的Search_Regex
。当设置替换标志时,所有实例都会被替换。Filename
是应该运行命令的文件名。
让我们看一下使用 sed
命令搜索和替换文件中的文本的常用参数和标志。我们将使用我们为演示目的创建的示例文件,即 live.txt
。
live.txt
Omicron is the endgame of Covid and Omicron 9876
如果 g
标志被忽略,则仅替换每行中搜索字符串的第一个实例。
$ sed -e 's/endgame/infinitywar/' live.txt
输出:
Omicron is the infinitywar of Covid and Omicron 9876
sed
用全局替换标志替换所有出现的搜索模式:
$ sed -e 's/Omicron/thanos/g' live.txt
输出:
thanos is the endgame of Covid and thanos 9876
正如你可能已经观察到的,字符串 Omicron
已被替换为 thanos
。
在 Bash 中的字符串中查找和替换分隔符 /
如果要发现和替换包含分隔符/
的字符串,你必须使用反斜杠\
来转义斜杠。例如,要将 /bin/bash
替换为 /usr/bin/zsh
,请使用以下命令:
$ sed -e 's/\/bin\/bash/\/usr\/bin\/zsh/g' live.txt
输出:
Omicron is the endgame of Covid and Omicron 9876
让我们使用竖线|
让我们更容易理解或冒号:
,尽管任何其他字符就足够了。
$ sed -e 's|/bin/bash|/usr/bin/zsh|g' live.txt
输出:
Omicron is the endgame of Covid and Omicron 9876
如你所见,结果与前一个相同。
查找所有数字并用 Bash 中的字符串数字替换它们
正则表达式还可以找到所有四个数字并将它们替换为字符串数字。例如:
$ sed -e 's/\b[0-9]\{4\}\b/number/g' live.txt
输出:
Omicron is the endgame of Covid, and Omicron number
如你所见,9876
被 number
字符串替换。
最后但同样重要的是,每当你使用 sed
编辑文件时,你应该始终进行备份。给 -i
选项一个备份文件的扩展名来完成这个。
例如,编辑 live.txt
并将原始文件保存为 live.txt
。如果你要使用 bak
,你可以通过以下方式做到这一点:
$ sed -i.bak 's/Omicron/thanos/g' live.txt
使用 ls
命令列出文件以确保已创建备份:
$ ls
输出:
live.txt
live.txt.bak
虽然一开始可能看起来很复杂,但使用 sed
查找和更改文件中的文本相对简单。