std::regex_constants::syntax_option_type

在头文件 `<regex>` 中定义
using syntax_option_type = /* implementation-defined */;	(1)	(C++11 起)
constexpr syntax_option_type icase = /* unspecified /; constexpr syntax_option_type nosubs = / unspecified /; constexpr syntax_option_type optimize = / unspecified /; constexpr syntax_option_type collate = / unspecified /; constexpr syntax_option_type ECMAScript = / unspecified /; constexpr syntax_option_type basic = / unspecified /; constexpr syntax_option_type extended = / unspecified /; constexpr syntax_option_type awk = / unspecified /; constexpr syntax_option_type grep = / unspecified /; constexpr syntax_option_type egrep = / unspecified */;	(2)	(C++11 起) (C++17 起为 inline)
inline constexpr syntax_option_type multiline = /* unspecified */;	(3)	(C++17 起)

1) syntax_option_type 是一个 BitmaskType，包含控制正则表达式行为的选项。

2,3) 类型 (1) 的可能值（icase、optimize 等）在 std::basic_regex 中重复。

语法选项	效果
`ECMAScript`	使用 Modified ECMAScript 正则表达式语法。
`basic`	使用基本 POSIX 正则表达式语法 (语法文档)。
`extended`	使用扩展 POSIX 正则表达式语法 (语法文档)。
`awk`	使用 POSIX 中 awk 工具使用的正则表达式语法 (语法文档)。
`grep`	使用 POSIX 中 grep 工具使用的正则表达式语法。这实际上与 `basic` 选项相同，只是添加了换行符 '\n' 作为交替分隔符。
`egrep`	使用 POSIX 中 grep 工具（带 -E 选项）使用的正则表达式语法。这实际上与 `extended` 选项相同，只是除了 '\|' 之外，还添加了换行符 '\n' 作为交替分隔符。
语法变体	效果
`icase`	字符匹配应不区分大小写。
`nosubs`	执行匹配时，所有标记的子表达式 `(expr)` 都被视为非标记子表达式 `(?:expr)`。没有匹配项存储在提供的 std::regex_match 结构中，且 mark_count() 为零。
`optimize`	指示正则表达式引擎加快匹配速度，潜在代价是构造速度变慢。例如，这可能意味着将非确定性 FSA 转换为确定性 FSA。
`collate`	形式为 "[a-b]" 的字符范围将对区域设置敏感。
`multiline` (C++17 起)	如果选择 ECMAScript 引擎，指定 `^` 匹配行首，`$` 匹配行尾。

在 ECMAScript, basic, extended, awk, grep, egrep 中最多只能选择一个语法选项。如果没有选择语法，则假定选择 ECMAScript。其他选项作为变体，例如 std::regex("meow", std::regex::icase) 等价于 std::regex("meow", std::regex::ECMAScript|std::regex::icase)。

[编辑] 注意

由于 POSIX 使用“最左最长”匹配规则（匹配最长的子序列，如果存在多个这样的子序列，则匹配第一个），因此它不适合解析标记语言，例如：POSIX 正则表达式如 "<tag[^>]*>.*</tag>" 将匹配从第一个 "<tag" 到最后一个 "</tag>" 的所有内容，包括介于两者之间的所有 "</tag>" 和 "<tag>"。另一方面，ECMAScript 支持非贪婪匹配，ECMAScript 正则表达式 "<tag[^>]*>.*?</tag>" 将只匹配到第一个结束标记。

[编辑] 示例

说明 ECMAScript 和 POSIX 正则表达式之间匹配算法的差异

运行此代码

#include <iostream>
#include <regex>
#include <string>
 
int main()
{
    std::string str = "zzxayyzz";
    std::regex re1(".*(a|xayy)"); // ECMA
    std::regex re2(".*(a|xayy)", std::regex::extended); // POSIX
 
    std::cout << "Searching for .*(a|xayy) in zzxayyzz:\n";
    std::smatch m;
    std::regex_search(str, m, re1);
    std::cout << "  ECMA (depth first search) match: " << m[0] << '\n';
    std::regex_search(str, m, re2);
    std::cout << "  POSIX (leftmost longest)  match: " << m[0] << '\n';
}

输出

Searching for .*(a|xayy) in zzxayyzz:
  ECMA (depth first search) match: zzxa
  POSIX (leftmost longest)  match: zzxayy

[编辑] 缺陷报告

下列更改行为的缺陷报告追溯地应用于以前出版的 C++ 标准。

缺陷报告	应用于	发布时的行为	正确的行为
LWG 2053	C++11	常量被声明为 static	移除了 static 说明符

[编辑] 参阅

basic_regex

(C++11)

正则表达式对象
(类模板) [编辑]

编译器支持
自由（freestanding）与宿主（hosted）
语言
标准库
标准库头文件
具名要求
特性测试宏 (C++20)
语言支持库
概念库 (C++20)
诊断库
内存管理库
元编程库 (C++11)
通用工具库
容器库
迭代器库
范围库 (C++20)
算法库
字符串库
文本处理库
数值库
日期和时间库
输入/输出库
文件系统库 (C++17)
并发支持库 (C++11)
执行控制库 (C++26)
技术规范
符号索引
外部库

类
basic_regex (C++11)
sub_match (C++11)
match_results (C++11)
算法
regex_match (C++11)
regex_search (C++11)
regex_replace (C++11)
迭代器
regex_iterator (C++11)
regex_token_iterator (C++11)
异常
regex_error (C++11)
特性
regex_traits (C++11)
常量
syntax_option_type (C++11)
match_flag_type (C++11)
error_type (C++11)
正则表达式语法
修改后的 ECMAScript-262 (C++11)

cppreference.cn

命名空间

变体

视图

操作

std::regex_constants::syntax_option_type

目录

[编辑] 常量

[编辑] 注意

[编辑] 示例

[编辑] 缺陷报告

[编辑] 参阅

导航

工具箱