C 语言中使用 strtok 函数
Jinku Hu
2023年10月12日
本文将演示如何在 C 语言中使用 strtok
函数的多种方法。
使用 strtok
函数对给定定界符的字符串进行标记化处理
strtok
函数是 C 标准库的一部分,定义在 <string.h>
头文件中。它将给定的字符串分解成由指定定界符分割的标记。strtok
需要两个参数-第一个参数是指向要标记化的字符串的指针,第二个参数是定界符字符串。请注意,定界符字符串是作为一组字符来处理的,表示单独的定界符。函数返回指向一个空结束的字符串的指针,它代表下一个标记。不过要注意的是,当同一个字符串被多次调用 strtok
进行解析时,在第一次调用函数后,第一个指针参数必须是 NULL
。
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int main(int argc, char *argv[]) {
char *str1, *token;
int j;
if (argc != 3) {
fprintf(stderr, "Usage: %s string delim\n", argv[0]);
exit(EXIT_FAILURE);
}
for (j = 1, str1 = argv[1];; j++, str1 = NULL) {
token = strtok(str1, argv[2]);
if (token == NULL) break;
printf("%d: %s\n", j, token);
}
exit(EXIT_SUCCESS);
}
示例命令:
./program "Temporary string to be parsed" " "
输出:
1: Temporary
2: string
3: to
4: be
5: parsed
使用 strtok_r
函数对带有两个定界符的字符串进行标记化
另外,还有另一个版本的函数,叫做 strtok_r
,它是一个重入式变体,更适合多线程程序。这两个函数都会修改作为第一个参数传递的字符串,而且它们不能对常量字符串进行修改。下面的示例代码将给定的字符串 token 化为一个两层的层次结构。第一个层次由作为程序第二个参数传递的定界符上的标记组成。内部循环将每个标记从初始标记化中分割出来,最后,程序将结果输出到控制台。
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int main(int argc, char *argv[]) {
char *str1, *str2, *token, *subtoken;
char *saveptr1, *saveptr2;
int j;
if (argc != 4) {
fprintf(stderr, "Usage: %s string delim subdelim\n", argv[0]);
exit(EXIT_FAILURE);
}
for (j = 1, str1 = argv[1];; j++, str1 = NULL) {
token = strtok_r(str1, argv[2], &saveptr1);
if (token == NULL) break;
printf("%d: %s\n", j, token);
for (str2 = token;; str2 = NULL) {
subtoken = strtok_r(str2, argv[3], &saveptr2);
if (subtoken == NULL) break;
printf(" --> %s\n", subtoken);
}
}
exit(EXIT_SUCCESS);
}
示例命令:
./program "Temporary string to be parsed" " " "aeio"
输出:
1: Temporary
--> T
--> mp
--> r
--> ry
2: string
--> str
--> ng
3: to
--> t
4: be
--> b
5: parsed
--> p
--> rs
--> d
作者: Jinku Hu