优秀的编程知识分享平台

网站首页 > 技术文章 正文

C++ 使用char_traits自定义字符串类

nanyue 2024-07-23 13:47:08 技术文章 15 ℃

使用char_traits自定义字符串类

string类是basic_string类的别名,其声明如下:

class basic_string<char, std::char_traits<char>>;


第一个模板参数提供了字符的类型。第二个模板参数提供了一个字符特性类,它为指定的字符类型提供了基本的字符和字符串操作。我们通常使用默认的char_traits<char>类。

通过提供我们自己的自定义字符特性类,我们可以修改字符串的行为。

如何做……

在本示例中,我们将为basic_string创建一个字符特性类,用于比较时忽略大小写:

首先,我们需要一个函数将字符转换为通用大小写。这里我们使用小写,但这只是一个任意选择。大写也同样有效:

constexpr char char_lower(const char& c) {  
    if(c >= 'A' && c <= 'Z') return c + ('a' - 'A');  
    else return c;  
}


这个函数必须是constexpr(对于C++20及更高版本),因此现有的std::tolower()函数在这里不适用。幸运的是,这是一个简单问题的简单解决方案。

我们的特性类叫做ci_traits(ci代表不区分大小写)。它继承自std::char_traits<char>:

class ci_traits : public std::char_traits<char> {  
public:  
    // ...  
};


继承允许我们仅覆盖我们需要的函数。

比较函数分别叫做lt()(表示小于)和eq()(表示等于):

static constexpr bool lt(char_type a, char_type b) noexcept {  
    return char_lower(a) < char_lower(b);  
}  
  
static constexpr bool eq(char_type a, char_type b) noexcept {  
    return char_lower(a) == char_lower(b);  
}


请注意,我们比较的是字符的小写版本。

还有一个compare()函数,用于比较两个C字符串。它返回+1表示大于,-1表示小于,0表示等于。我们可以使用spaceship <=>运算符来实现这一点:

static constexpr int compare(const char_type* s1,  
        const char_type* s2, size_t count) {  
    // ... 使用spaceship运算符进行比较 ...  
}


最后,我们需要实现一个find()函数。这返回一个指向找到的第一个字符的指针,如果未找到则返回nullptr:

static constexpr const char_type* find(const char_type* p,  
        size_t count, const char_type& ch) {  
    // ... 搜索并返回找到的字符的指针 ...  
}


现在我们有了ci_traits类,我们可以为我们的字符串类定义一个别名:

using ci_string = std::basic_string<char, ci_traits>;


在main()函数中,我们定义一个string和一个ci_string:

int main() {  
    string s{"Foo Bar Baz"};  
    ci_string ci_s{"Foo Bar Baz"};  
    // ...  
}


我们想用cout打印它们,但这行不通:

cout << "string: " << s << '\n';  
cout << "ci_string: " << ci_s << '\n';


首先,我们需要为operator<<重载一个函数:

std::ostream& operator<<(std::ostream& os,  
        const ci_string& str) {  
    return os << str.c_str();  
}


现在,我们得到以下输出:

string: Foo Bar Baz  
ci_string: Foo Bar Baz


让我们比较两个不同大小写的ci_string对象:

ci_string compare1{"CoMpArE StRiNg"};  
ci_string compare2{"compare string"};  
// ... 比较它们并打印结果 ...


输出:

Match! CoMpArE StRiNg == compare string


比较工作符合预期。

使用ci_s对象上的find()函数,我们搜索一个小写b并找到一个大写B:

size_t found = ci_s.find('b');  
// ... 打印找到的位置和字符 ...


输出:

found: pos 4 char B


**注意**:

请注意,format()函数不需要特化。这是在fmt.dev的参考实现上测试的。它在MSVC的format()预览版上不起作用,即使进行了特化。希望在未来版本中会得到修复。

它是如何工作的……

这个示例通过将字符串类模板特化中的std::char_traits类替换为我们自己的ci_traits类来工作。basic_string类使用特性类来执行其基本特定于字符的函数,如比较和搜索。当我们用自己的类替换它时,我们可以改变这些基本行为。

还有更多……

我们还可以覆盖assign()和copy()成员函数来创建一个存储小写字符的类:

class lc_traits : public std::char_traits<char> {  
public:  
    // ... 实现assign()和copy()以存储小写字符 ...  
};


现在,我们可以创建一个lc_string别名,该对象存储小写字符:

using lc_string = std::basic_string<char, lc_traits>;  
// ... 使用lc_string对象 ...


**注意**:

这些技术在GCC和Clang上按预期工作,但在MSVC的预览版上不起作用。我预计在未来的版本中会得到修复。

Tags:

最近发表
标签列表