命名空间
变体
操作

std::regex_traits<CharT>::lookup_classname

来自 cppreference.com
< cpp‎ | regex‎ | regex traits
template< class ForwardIt >

char_class_type lookup_classname( ForwardIt first,
                                  ForwardIt last,

                                  bool icase = false ) const;

如果字符序列[firstlast)代表当前注入的区域设置中有效的字符类的名称(即正则表达式中[::]之间的字符串),则返回表示此字符类的实现定义值。否则,返回零。

如果参数icasetrue,则字符类会忽略字符的大小写,例如,带有std::regex_constants::icase的正则表达式[:lower:]会生成对带有[firstlast)表示字符串"lower"icase == truestd::regex_traits<>::lookup_classname()的调用。此调用返回与带有icase == false的正则表达式[:alpha:]生成的调用相同的位掩码。

以下窄字符和宽字符类名称始终会被std::regex_traits<char>std::regex_traits<wchar_t>分别识别,并且返回的分类(icase == false)对应于通过注入的区域设置的std::ctype方面获得的匹配分类,如下所示

  字符类名称     std::ctype分类  
窄字符 宽字符
"alnum" L"alnum" std::ctype_base::alnum
"alpha" L"alpha" std::ctype_base::alpha
"blank" L"blank" std::ctype_base::blank
"cntrl" L"cntrl" std::ctype_base::cntrl
"digit" L"digit" std::ctype_base::digit
"graph" L"graph" std::ctype_base::graph
"lower" L"lower" std::ctype_base::lower
"print" L"print" std::ctype_base::print
"punct" L"punct" std::ctype_base::punct
"space" L"space" std::ctype_base::space
"upper" L"upper" std::ctype_base::upper
"xdigit" L"xdigit" std::ctype_base::xdigit
"d" L"d" std::ctype_base::digit
"s" L"s" std::ctype_base::space
"w" L"w" std::ctype_base::alnum
可选地添加了'_'

对于字符串"w"返回的分类可能与"alnum"完全相同,在这种情况下,isctype()会显式地添加'_'

系统提供的区域设置可能会提供其他分类,例如"jdigit""jkanji"(在这种情况下,它们也可以通过std::wctype访问)。

内容

[编辑] 参数

first, last - 一对迭代器,它们确定代表字符类名称的字符序列
icase - 如果true,则会忽略字符分类中的大小写区别
类型要求
-
ForwardIt必须满足LegacyForwardIterator的要求。

[编辑] 返回值

由给定字符类确定的字符分类的位掩码,或者如果该类未知,则为char_class_type()

[编辑] 示例

演示了lookup_classname() / isctype()的自定义正则表达式特性实现。

#include <cwctype>
#include <iostream>
#include <locale>
#include <regex>
 
// This custom regex traits uses wctype/iswctype to implement lookup_classname/isctype.
struct wctype_traits : std::regex_traits<wchar_t>
{
    using char_class_type = std::wctype_t;
 
    template<class It>
    char_class_type lookup_classname(It first, It last, bool = false) const
    {
        return std::wctype(std::string(first, last).c_str());
    }
 
    bool isctype(wchar_t c, char_class_type f) const
    {
        return std::iswctype(c, f);
    }
};
 
int main()
{
    std::locale::global(std::locale("ja_JP.utf8"));
    std::wcout.sync_with_stdio(false);
    std::wcout.imbue(std::locale());
 
    std::wsmatch m;
    std::wstring in = L"風の谷のナウシカ";
    // matches all characters (they are classified as alnum)
    std::regex_search(in, m, std::wregex(L"([[:alnum:]]+)"));
    std::wcout << "alnums: " << m[1] << '\n'; // prints "風の谷のナウシカ"
    // matches only the katakana
    std::regex_search(in, m,
                      std::basic_regex<wchar_t, wctype_traits>(L"([[:jkata:]]+)"));
    std::wcout << "katakana: " << m[1] << '\n'; // prints "ナウシカ"
}

输出

alnums: 風の谷のナウシカ
katakana: ナウシカ

[编辑] 另请参见

指示是否属于字符类
(公有成员函数)
在当前 C 区域设置中查找字符分类类别
(函数) [编辑]