命名空间
变体
操作

std::regex_constants::syntax_option_type

来自 cppreference.cn
< cpp‎ | regex
定义于头文件 <regex>
using syntax_option_type = /* implementation-defined */;
(1) (since C++11)
constexpr syntax_option_type icase      = /* unspecified */;

constexpr syntax_option_type nosubs     = /* unspecified */;
constexpr syntax_option_type optimize   = /* unspecified */;
constexpr syntax_option_type collate    = /* unspecified */;
constexpr syntax_option_type ECMAScript = /* unspecified */;
constexpr syntax_option_type basic      = /* unspecified */;
constexpr syntax_option_type extended   = /* unspecified */;
constexpr syntax_option_type awk        = /* unspecified */;
constexpr syntax_option_type grep       = /* unspecified */;

constexpr syntax_option_type egrep      = /* unspecified */;
(2) (since C++11)
(inline since C++17)
inline constexpr syntax_option_type multiline = /* unspecified */;
(3) (since C++17)
1) syntax_option_type 是一个 BitmaskType,其中包含控制正则表达式行为的选项。
2,3) 类型 (1) 的可能值(icaseoptimize 等)在 std::basic_regex 内部重复。

目录

[编辑] 常量

语法选项 效果
ECMAScript 使用 Modified ECMAScript 正则表达式语法
basic 使用基本 POSIX 正则表达式语法(语法文档)。
extended 使用扩展 POSIX 正则表达式语法(语法文档)。
awk 使用 POSIX 中 awk 实用程序使用的正则表达式语法(语法文档)。
grep 使用 POSIX 中 grep 实用程序使用的正则表达式语法。这实际上与 basic 选项相同,但添加了换行符 '\n' 作为交替分隔符。
egrep 使用带有 -E 选项的 grep 实用程序在 POSIX 中使用的正则表达式语法。这实际上与 extended 选项相同,但除了 '|' 之外,还添加了换行符 '\n' 作为交替分隔符。
语法变体 效果
icase 字符匹配应不区分大小写地执行。
nosubs 执行匹配时,所有标记的子表达式 (expr) 都被视为非标记子表达式 (?:expr)。没有匹配项存储在提供的 std::regex_match 结构中,并且 mark_count() 为零。
optimize 指示正则表达式引擎使匹配更快,但可能会以降低构造速度为代价。例如,这可能意味着将非确定性 FSA 转换为确定性 FSA。
collate “[a-b]” 形式的字符范围将是区域设置敏感的。
multiline (C++17) 指定如果选择了 ECMAScript 引擎,则 ^ 应匹配行的开头,而 $ 应匹配行的结尾。

ECMAScriptbasicextendedawkgrepegrep 中最多可以选择一个语法选项。如果未选择任何语法,则假定选择了 ECMAScript。其他选项用作变体,因此 std::regex("meow", std::regex::icase) 等效于 std::regex("meow", std::regex::ECMAScript|std::regex::icase)

[编辑] 注释

由于 POSIX 使用“最左最长”匹配规则(匹配最长的匹配子序列,如果有多个这样的子序列,则匹配第一个),因此它不适合例如解析标记语言:POSIX 正则表达式(例如 "<tag[^>]*>.*</tag>")将匹配从第一个 "<tag" 到最后一个 "</tag>" 的所有内容,包括介于两者之间的每个 "</tag>""<tag>"。另一方面,ECMAScript 支持非贪婪匹配,ECMAScript 正则表达式 "<tag[^>]*>.*?</tag>" 将仅匹配到第一个结束标记。

[编辑] 示例

说明 ECMAScript 和 POSIX 正则表达式之间匹配算法的差异

#include <iostream>
#include <regex>
#include <string>
 
int main()
{
    std::string str = "zzxayyzz";
    std::regex re1(".*(a|xayy)"); // ECMA
    std::regex re2(".*(a|xayy)", std::regex::extended); // POSIX
 
    std::cout << "Searching for .*(a|xayy) in zzxayyzz:\n";
    std::smatch m;
    std::regex_search(str, m, re1);
    std::cout << "  ECMA (depth first search) match: " << m[0] << '\n';
    std::regex_search(str, m, re2);
    std::cout << "  POSIX (leftmost longest)  match: " << m[0] << '\n';
}

输出

Searching for .*(a|xayy) in zzxayyzz:
  ECMA (depth first search) match: zzxa
  POSIX (leftmost longest)  match: zzxayy

[编辑] 缺陷报告

以下行为变更缺陷报告已追溯应用于先前发布的 C++ 标准。

DR 应用于 已发布行为 正确行为
LWG 2053 C++11 常量被声明为 static 移除了 static 说明符

[编辑] 参见

正则表达式对象
(类模板) [编辑]