std::experimental::parallel::reduce
来自 cppreference.com
< cpp | experimental
定义在头文件 <experimental/numeric> 中 |
||
template< class InputIt > typename std::iterator_traits<InputIt>::value_type reduce( |
(1) | (并行 TS) |
template< class ExecutionPolicy, class InputIterator > typename std::iterator_traits<InputIt>::value_type reduce( |
(2) | (并行 TS) |
template< class InputIt, class T > T reduce( InputIt first, InputIt last, T init ); |
(3) | (并行 TS) |
template< class ExecutionPolicy, class InputIt, class T > T reduce( ExecutionPolicy&& policy, InputIt first, InputIt last, T init ); |
(4) | (并行 TS) |
template< class InputIt, class T, class BinaryOp > T reduce( InputIt first, InputIt last, T init, BinaryOp binary_op ); |
(5) | (并行 TS) |
template< class ExecutionPolicy, class InputIt, class T, class BinaryOp > T reduce( ExecutionPolicy&& policy, |
(6) | (并行 TS) |
1) 等同于 reduce(first, last, typename std::iterator_traits<InputIt>::value_type{}).
3) 等同于 reduce(first, last, init, std::plus<>()).
5) 减少范围
[
first,
last)
,可能以未指定的顺序排列和聚合,以及初始值 init 在 binary_op 上。2,4,6) 等同于 (1,3,5),但根据 policy 执行。
如果 binary_op 不具有结合性或不具有交换性,则行为是不确定的。
如果 binary_op 修改了 [
first,
last)
中的任何元素或使其中任何迭代器失效,则行为未定义。
内容 |
[编辑] 参数
first, last | - | 要应用算法的元素范围 |
init | - | 广义和的初始值 |
policy | - | 该 执行策略 |
binary_op | - | 二元 函数对象,它将以未指定的顺序应用于对输入迭代器解引用结果、其他 binary_op 结果和 init 的结果。 |
类型要求 | ||
-InputIt 必须满足 LegacyInputIterator 的要求。 |
[编辑] 返回值
init 和 *first、*(first + 1)、... *(last - 1) 在 binary_op 上的广义和,
其中广义和 GSUM(op, a
1, ..., a
N) 定义如下
- 如果 N=1,则为 a
1 - 如果 N > 1,则为 op(GSUM(op, b
1, ..., b
K), GSUM(op, b
M, ..., b
N)),其中
- b
1, ..., b
N 可以是 a1, ..., aN 的任何排列,并且 - 1 < K+1 = M ≤ N
- b
换句话说,范围的元素可以以任意顺序分组和重新排列。
[编辑] 复杂度
O(last - first) 次 binary_op 应用。
[编辑] 异常
- 如果作为算法一部分调用的函数执行时抛出异常,
- 如果
policy
是parallel_vector_execution_policy
,则调用 std::terminate。 - 如果
policy
是sequential_execution_policy
或parallel_execution_policy
,则算法退出并带有包含所有未捕获异常的 exception_list。如果只有一个未捕获异常,则算法可能会在不将其包装在exception_list
中的情况下重新抛出它。在遇到第一个异常后,算法将执行多少工作才能返回是不确定的。 - 如果
policy
是其他类型,则行为是实现定义的。
- 如果
- 如果算法无法分配内存(无论是为自己还是在处理用户异常时构造
exception_list
),则会抛出std::bad_alloc。
[编辑] 注释
如果范围为空,则返回未修改的init。
- 如果
policy
是sequential_execution_policy
的实例,则所有操作都在调用线程中执行。 - 如果
policy
是parallel_execution_policy
的实例,则操作可能在未指定的数量的线程中执行,这些线程彼此之间是无序的。 - 如果
policy
是parallel_vector_execution_policy
的实例,则执行可以并行化和矢量化:函数体边界不被尊重,用户代码可以以任意方式重叠和组合(特别是,这意味着用户提供的可调用对象不能获取互斥锁来访问共享资源)。
[编辑] 示例
reduce 是 std::accumulate 的无序版本。
运行此代码
#include <chrono> #include <experimental/execution_policy> #include <experimental/numeric> #include <iostream> #include <numeric> #include <vector> int main() { std::vector<double> v(10'000'007, 0.5); { auto t1 = std::chrono::high_resolution_clock::now(); double result = std::accumulate(v.begin(), v.end(), 0.0); auto t2 = std::chrono::high_resolution_clock::now(); std::chrono::duration<double, std::milli> ms = t2 - t1; std::cout << std::fixed << "std::accumulate result " << result << " took " << ms.count() << " ms\n"; } { auto t1 = std::chrono::high_resolution_clock::now(); double result = std::experimental::parallel::reduce( std::experimental::parallel::par, v.begin(), v.end()); auto t2 = std::chrono::high_resolution_clock::now(); std::chrono::duration<double, std::milli> ms = t2 - t1; std::cout << "parallel::reduce result " << result << " took " << ms.count() << " ms\n"; } }
可能的输出
std::accumulate result 5000003.50000 took 12.7365 ms parallel::reduce result 5000003.50000 took 5.06423 ms
[编辑] 另请参阅
将一系列元素加起来或折叠起来 (函数模板) | |
将函数应用于一系列元素,并将结果存储在目标范围内 (函数模板) | |
(并行 TS) |
应用一个函子,然后无序地减少 (函数模板) |