使用带有正则表达式的 sed 查找和替换复杂字符串

Nilesh Katuwal 2023年1月30日
  1. 在 Bash 中使用 sed 查找和替换字符串
  2. 在 Bash 中的字符串中查找和替换分隔符 /
  3. 查找所有数字并用 Bash 中的字符串数字替换它们
使用带有正则表达式的 sed 查找和替换复杂字符串

处理文本文件时,你经常需要识别和替换一个或多个文件中的文本字符串。

sed 是一个流编辑器。它可以对文件和输入流(如管道)执行基本的文本操作。你可以使用 sed 搜索、查找和替换单词和行,以及插入和删除它们。

支持基本和扩展的 regex,允许你匹配复杂的模式。在这篇文章中,我们将了解如何使用 sed 查找和替换字符串。我们还将演示如何使用递归搜索和替换。

在 Bash 中使用 sed 查找和替换字符串

sed 有多种版本,每个版本都有其特点。

Linux 发行版默认预装了 GNU sed,但 Mac OS 使用 BSD 版本。我们将使用 GNU 版本。

该语法用于使用 sed 搜索和替换文本:

sed -e 's/Search_Regex/substitution/g' Filename

在上面使用的语法中,定义如下:

  • -e 是默认写入标准输出的 sed 输出。该参数指示 sed 在当前位置编辑文件。如果定义了扩展名,则会生成替换文件。
  • /// 是用作分隔符的字符。尽管大多数人使用斜线 (/) 字符,但它可以是任何字符。
  • Search_Regex 是一个搜索的东西。我们将使用 regex 或常规字符串。
  • substitution 用作要替换的字符串。
  • g 是全局替换的标志。sed 默认逐行读取文件,并且仅更改每行中第一次出现的 Search_Regex。当设置替换标志时,所有实例都会被替换。
  • Filename 是应该运行命令的文件名。

让我们看一下使用 sed 命令搜索和替换文件中的文本的常用参数和标志。我们将使用我们为演示目的创建的示例文件,即 live.txt

live.txt 
Omicron is the endgame of Covid and Omicron 9876

如果 g 标志被忽略,则仅替换每行中搜索字符串的第一个实例。

$ sed -e 's/endgame/infinitywar/' live.txt

输出:

Omicron is the infinitywar of Covid and Omicron 9876

sed 用全局替换标志替换所有出现的搜索模式:

$ sed -e 's/Omicron/thanos/g' live.txt

输出:

thanos is the endgame of Covid and thanos 9876

正如你可能已经观察到的,字符串 Omicron 已被替换为 thanos

在 Bash 中的字符串中查找和替换分隔符 /

如果要发现和替换包含分隔符/ 的字符串,你必须使用反斜杠\ 来转义斜杠。例如,要将 /bin/bash 替换为 /usr/bin/zsh,请使用以下命令:

$ sed -e 's/\/bin\/bash/\/usr\/bin\/zsh/g' live.txt

输出:

Omicron is the endgame of Covid and Omicron 9876

让我们使用竖线|让我们更容易理解或冒号:,尽管任何其他字符就足够了。

$ sed -e 's|/bin/bash|/usr/bin/zsh|g' live.txt

输出:

Omicron is the endgame of Covid and Omicron 9876

如你所见,结果与前一个相同。

查找所有数字并用 Bash 中的字符串数字替换它们

正则表达式还可以找到所有四个数字并将它们替换为字符串数字。例如:

$ sed -e 's/\b[0-9]\{4\}\b/number/g' live.txt

输出:

Omicron is the endgame of Covid, and Omicron number

如你所见,9876number 字符串替换。

最后但同样重要的是,每当你使用 sed 编辑文件时,你应该始终进行备份。给 -i 选项一个备份文件的扩展名来完成这个。

例如,编辑 live.txt 并将原始文件保存为 live.txt。如果你要使用 bak,你可以通过以下方式做到这一点:

$ sed -i.bak 's/Omicron/thanos/g' live.txt

使用 ls 命令列出文件以确保已创建备份:

$ ls

输出:

live.txt
live.txt.bak 

虽然一开始可能看起来很复杂,但使用 sed 查找和更改文件中的文本相对简单。