C++ 中字符串的 sizeof 运算符和 strlen 函数的区别
本文将演示在 C++ 中使用 sizeof
运算符而不是 strlen
函数处理字符串时的多个差异。
sizeof
运算符特征和使用场景
sizeof
运算符是一个一元运算符,用于检索给定表达式或数据类型的存储大小。此运算符以字节为单位评估对象大小,并且 sizeof(char)
保证为 1
。
有一种误解,认为 1 字节总是等于 8 位,因此,我们可以以位为单位计算对象的大小。实际上,语言本身并不能保证一个字节是 8 位。它主要取决于底层硬件平台。尽管如此,大多数当代通用硬件仍使用 8 位字节。
请注意,sizeof
运算符不能应用于包含函数或不完整类型或位域的表达式。在以下示例代码中,我们将 sizeof
运算符应用于两个不同类型的数组,结果在你的平台上也可能相同。由于 char
保证有 1 个字节的大小,20 个字符的数组将占用 20 个字节。
另一方面,long long
数据类型是实现定义的,在这种情况下,它恰好是 8 个字节。因此,总数组大小为 160 字节。请注意,我们还可以通过将 sizeof
整个数组除以 sizeof
一个元素来找到数组中的元素数,如下一个示例的最后几行所示。
#include <iostream>
using std::cout;
using std::endl;
int main() {
char arr[20];
long long arr2[20];
cout << "sizeof ( array of 20 long longs ) : " << sizeof arr << endl;
cout << "sizeof ( array of 20 long longs ) : " << sizeof arr2 << endl;
cout << "length of array of 20 chars) : "
<< ((sizeof arr) / (sizeof arr[0])) << endl;
cout << "length of array of 20 long longs ): "
<< ((sizeof arr2) / (sizeof arr2[0])) << endl;
return EXIT_SUCCESS;
}
输出:
sizeof ( array of 20 long longs ) : 20
sizeof ( array of 20 long longs ) : 160
length of array of 20 chars) : 20
length of array of 20 long longs ): 20
使用 sizeof
运算符来查找字符串的长度是错误的。让我们考虑 C++ 中字符串的两种表示类型,一个字符串和一个 std::string
类。前一个主要使用 char
指针访问,在其上应用 sizeof
将检索指针本身的存储大小,而不是整个字符串。
如果我们尝试使用 sizeof
运算符检索 std::string
对象的大小,我们将获得对象的存储大小,这将不是字符串中的字符数,如下面的代码片段所示。
#include <cstring>
#include <iostream>
#include <string>
using std::cout;
using std::endl;
using std::string;
int main() {
const char *text1 = "arbitrary string value 1";
string text2 = "arbitrary string value 2";
cout << "sizeof char* : " << sizeof text1 << endl;
cout << "sizeof string: " << sizeof text2 << endl;
cout << "sizeof string.data: " << sizeof text2.data() << endl;
return EXIT_SUCCESS;
}
输出:
sizeof char* : 8
sizeof string: 32
sizeof string.data: 8
然后我们得到了 strlen
函数,它是 C 字符串库的残余。它计算给定字符串的长度,函数返回字节数作为整数值。strlen
可以应用于存储有效字符串的 char
指针或 std::string::c_str
返回的值,但它不应该是 C++ 程序员的选择。
#include <cstring>
#include <iostream>
#include <string>
using std::cout;
using std::endl;
using std::string;
int main() {
const char *text1 = "arbitrary string value 1";
string text2 = "arbitrary string value 2";
cout << "strlen char* : " << strlen(text1) << endl;
cout << "strlen string: " << strlen(text2.c_str()) << endl;
return EXIT_SUCCESS;
}
输出:
strlen char* : 24
strlen string: 24
使用 std::string::size
成员函数检索字符串中的字符数
相反,C++ 程序员应该利用 std::string
类的 size
成员函数,因为它提供了一种更安全的处理字符串的方法。请注意,如果我们有一个字符串,我们甚至可以使用 size
成员函数。我们需要构造一个新的 string
对象并直接对返回值调用 size
函数。以下代码示例显示了这两种方案的主要用途。
#include <cstring>
#include <iostream>
#include <string>
using std::cout;
using std::endl;
using std::string;
int main() {
const char *text1 = "arbitrary string value 1";
string text2 = "arbitrary string value 2";
cout << "length char* : " << string(text1).size() << endl;
cout << "length string: " << text2.size() << endl;
return EXIT_SUCCESS;
}
输出:
length char* : 24
length string: 24