std::regex_constants::syntax_option_type
定义于头文件 <regex> |
||
using syntax_option_type = /* implementation-defined */; |
(1) | (since C++11) |
constexpr syntax_option_type icase = /* unspecified */; constexpr syntax_option_type nosubs = /* unspecified */; |
(2) | (since C++11) (inline since C++17) |
inline constexpr syntax_option_type multiline = /* unspecified */; |
(3) | (since C++17) |
目录 |
[编辑] 常量
语法选项 | 效果 |
ECMAScript
|
使用 Modified ECMAScript 正则表达式语法。 |
basic
|
使用基本 POSIX 正则表达式语法(语法文档)。 |
extended
|
使用扩展 POSIX 正则表达式语法(语法文档)。 |
awk
|
使用 POSIX 中 awk 实用程序使用的正则表达式语法(语法文档)。 |
grep
|
使用 POSIX 中 grep 实用程序使用的正则表达式语法。这实际上与 basic 选项相同,但添加了换行符 '\n' 作为交替分隔符。 |
egrep
|
使用带有 -E 选项的 grep 实用程序在 POSIX 中使用的正则表达式语法。这实际上与 extended 选项相同,但除了 '|' 之外,还添加了换行符 '\n' 作为交替分隔符。 |
语法变体 | 效果 |
icase
|
字符匹配应不区分大小写地执行。 |
nosubs
|
执行匹配时,所有标记的子表达式 (expr) 都被视为非标记子表达式 (?:expr) 。没有匹配项存储在提供的 std::regex_match 结构中,并且 mark_count() 为零。 |
optimize
|
指示正则表达式引擎使匹配更快,但可能会以降低构造速度为代价。例如,这可能意味着将非确定性 FSA 转换为确定性 FSA。 |
collate
|
“[a-b]” 形式的字符范围将是区域设置敏感的。 |
multiline (C++17) |
指定如果选择了 ECMAScript 引擎,则 ^ 应匹配行的开头,而 $ 应匹配行的结尾。 |
在 ECMAScript
、basic
、extended
、awk
、grep
、egrep
中最多可以选择一个语法选项。如果未选择任何语法,则假定选择了 ECMAScript
。其他选项用作变体,因此 std::regex("meow", std::regex::icase) 等效于 std::regex("meow", std::regex::ECMAScript|std::regex::icase)。
[编辑] 注释
由于 POSIX 使用“最左最长”匹配规则(匹配最长的匹配子序列,如果有多个这样的子序列,则匹配第一个),因此它不适合例如解析标记语言:POSIX 正则表达式(例如 "<tag[^>]*>.*</tag>")将匹配从第一个 "<tag" 到最后一个 "</tag>" 的所有内容,包括介于两者之间的每个 "</tag>" 和 "<tag>"。另一方面,ECMAScript 支持非贪婪匹配,ECMAScript 正则表达式 "<tag[^>]*>.*?</tag>" 将仅匹配到第一个结束标记。
[编辑] 示例
说明 ECMAScript 和 POSIX 正则表达式之间匹配算法的差异
#include <iostream> #include <regex> #include <string> int main() { std::string str = "zzxayyzz"; std::regex re1(".*(a|xayy)"); // ECMA std::regex re2(".*(a|xayy)", std::regex::extended); // POSIX std::cout << "Searching for .*(a|xayy) in zzxayyzz:\n"; std::smatch m; std::regex_search(str, m, re1); std::cout << " ECMA (depth first search) match: " << m[0] << '\n'; std::regex_search(str, m, re2); std::cout << " POSIX (leftmost longest) match: " << m[0] << '\n'; }
输出
Searching for .*(a|xayy) in zzxayyzz: ECMA (depth first search) match: zzxa POSIX (leftmost longest) match: zzxayy
[编辑] 缺陷报告
以下行为变更缺陷报告已追溯应用于先前发布的 C++ 标准。
DR | 应用于 | 已发布行为 | 正确行为 |
---|---|---|---|
LWG 2053 | C++11 | 常量被声明为 static | 移除了 static 说明符 |
[编辑] 参见
(C++11) |
正则表达式对象 (类模板) |