使用char_traits自定义字符串类
string类是basic_string类的别名,其声明如下:
class basic_string<char, std::char_traits<char>>;
第一个模板参数提供了字符的类型。第二个模板参数提供了一个字符特性类,它为指定的字符类型提供了基本的字符和字符串操作。我们通常使用默认的char_traits<char>类。
通过提供我们自己的自定义字符特性类,我们可以修改字符串的行为。
如何做……
在本示例中,我们将为basic_string创建一个字符特性类,用于比较时忽略大小写:
首先,我们需要一个函数将字符转换为通用大小写。这里我们使用小写,但这只是一个任意选择。大写也同样有效:
constexpr char char_lower(const char& c) {
if(c >= 'A' && c <= 'Z') return c + ('a' - 'A');
else return c;
}
这个函数必须是constexpr(对于C++20及更高版本),因此现有的std::tolower()函数在这里不适用。幸运的是,这是一个简单问题的简单解决方案。
我们的特性类叫做ci_traits(ci代表不区分大小写)。它继承自std::char_traits<char>:
class ci_traits : public std::char_traits<char> {
public:
// ...
};
继承允许我们仅覆盖我们需要的函数。
比较函数分别叫做lt()(表示小于)和eq()(表示等于):
static constexpr bool lt(char_type a, char_type b) noexcept {
return char_lower(a) < char_lower(b);
}
static constexpr bool eq(char_type a, char_type b) noexcept {
return char_lower(a) == char_lower(b);
}
请注意,我们比较的是字符的小写版本。
还有一个compare()函数,用于比较两个C字符串。它返回+1表示大于,-1表示小于,0表示等于。我们可以使用spaceship <=>运算符来实现这一点:
static constexpr int compare(const char_type* s1,
const char_type* s2, size_t count) {
// ... 使用spaceship运算符进行比较 ...
}
最后,我们需要实现一个find()函数。这返回一个指向找到的第一个字符的指针,如果未找到则返回nullptr:
static constexpr const char_type* find(const char_type* p,
size_t count, const char_type& ch) {
// ... 搜索并返回找到的字符的指针 ...
}
现在我们有了ci_traits类,我们可以为我们的字符串类定义一个别名:
using ci_string = std::basic_string<char, ci_traits>;
在main()函数中,我们定义一个string和一个ci_string:
int main() {
string s{"Foo Bar Baz"};
ci_string ci_s{"Foo Bar Baz"};
// ...
}
我们想用cout打印它们,但这行不通:
cout << "string: " << s << '\n';
cout << "ci_string: " << ci_s << '\n';
首先,我们需要为operator<<重载一个函数:
std::ostream& operator<<(std::ostream& os,
const ci_string& str) {
return os << str.c_str();
}
现在,我们得到以下输出:
string: Foo Bar Baz
ci_string: Foo Bar Baz
让我们比较两个不同大小写的ci_string对象:
ci_string compare1{"CoMpArE StRiNg"};
ci_string compare2{"compare string"};
// ... 比较它们并打印结果 ...
输出:
Match! CoMpArE StRiNg == compare string
比较工作符合预期。
使用ci_s对象上的find()函数,我们搜索一个小写b并找到一个大写B:
size_t found = ci_s.find('b');
// ... 打印找到的位置和字符 ...
输出:
found: pos 4 char B
**注意**:
请注意,format()函数不需要特化。这是在fmt.dev的参考实现上测试的。它在MSVC的format()预览版上不起作用,即使进行了特化。希望在未来版本中会得到修复。
它是如何工作的……
这个示例通过将字符串类模板特化中的std::char_traits类替换为我们自己的ci_traits类来工作。basic_string类使用特性类来执行其基本特定于字符的函数,如比较和搜索。当我们用自己的类替换它时,我们可以改变这些基本行为。
还有更多……
我们还可以覆盖assign()和copy()成员函数来创建一个存储小写字符的类:
class lc_traits : public std::char_traits<char> {
public:
// ... 实现assign()和copy()以存储小写字符 ...
};
现在,我们可以创建一个lc_string别名,该对象存储小写字符:
using lc_string = std::basic_string<char, lc_traits>;
// ... 使用lc_string对象 ...
**注意**:
这些技术在GCC和Clang上按预期工作,但在MSVC的预览版上不起作用。我预计在未来的版本中会得到修复。