std::experimental::parallel::reduce
来自 cppreference.cn
定义于头文件 <experimental/numeric> |
||
template< class InputIt > typename std::iterator_traits<InputIt>::value_type reduce( |
(1) | (并行 TS) |
template< class ExecutionPolicy, class InputIterator > typename std::iterator_traits<InputIt>::value_type reduce( |
(2) | (并行 TS) |
template< class InputIt, class T > T reduce( InputIt first, InputIt last, T init ); |
(3) | (并行 TS) |
template< class ExecutionPolicy, class InputIt, class T > T reduce( ExecutionPolicy&& policy, InputIt first, InputIt last, T init ); |
(4) | (并行 TS) |
template< class InputIt, class T, class BinaryOp > T reduce( InputIt first, InputIt last, T init, BinaryOp binary_op ); |
(5) | (并行 TS) |
template< class ExecutionPolicy, class InputIt, class T, class BinaryOp > T reduce( ExecutionPolicy&& policy, |
(6) | (并行 TS) |
1) 等同于 reduce(first, last, typename std::iterator_traits<InputIt>::value_type{})。
3) 等同于 reduce(first, last, init, std::plus<>())。
5) 对范围
[
first,
last)
进行归约,可能以未指定的方式进行排列和聚合,并结合初始值 init,使用 binary_op。2,4,6) 与 (1,3,5) 相同,但根据 policy 执行。
如果 binary_op 不满足结合律或交换律,则行为不确定。
如果 binary_op 修改了 [
first,
last)
中的任何元素或使任何迭代器失效,则行为未定义。
目录 |
[编辑] 参数
first, last | - | 要应用算法的元素范围 |
init | - | 广义和的初始值 |
policy | - | 执行策略 |
binary_op | - | 二元 函数对象 (FunctionObject),将以未指定顺序应用于解引用输入迭代器的结果、其他 binary_op 的结果和 init。 |
类型要求 | ||
-InputIt 必须满足 LegacyInputIterator 的要求。 |
[编辑] 返回值
init 和 *first, *(first + 1), ... *(last - 1) 经过 binary_op 的广义和,
其中广义和 GSUM(op, a1, ..., aN) 定义如下:
- 如果 N=1,则为 a1
- 如果 N > 1,则为 op(GSUM(op, b1, ..., bK), GSUM(op, bM, ..., bN)),其中
- b1, ..., bN 可以是 a1, ..., aN 的任何排列,并且
- 1 < K+1 = M ≤ N
换句话说,范围的元素可以以任意顺序分组和重新排列。
[编辑] 复杂度
O(last - first) 次 binary_op 的应用。
[编辑] 异常
- 如果作为算法一部分调用的函数抛出异常,
- 如果 `policy` 是 `parallel_vector_execution_policy`,则调用 std::terminate。
- 如果 `policy` 是 `sequential_execution_policy` 或 `parallel_execution_policy`,则算法以包含所有未捕获异常的 exception_list 退出。如果只有一个未捕获异常,算法可能会直接重新抛出它,而不将其封装在 `exception_list` 中。在遇到第一个异常后,算法在返回之前会执行多少工作是未指定的。
- 如果 `policy` 是其他类型,则行为由实现定义。
- 如果算法未能分配内存(无论是为自身还是在处理用户异常时构造 `exception_list`),则抛出 std::bad_alloc。
[编辑] 注意
如果范围为空,则返回未修改的 init。
- 如果 `policy` 是 `sequential_execution_policy` 的实例,则所有操作都在调用线程中执行。
- 如果 `policy` 是 `parallel_execution_policy` 的实例,则操作可能在未指定数量的线程中执行,且彼此之间序列不定。
- 如果 `policy` 是 `parallel_vector_execution_policy` 的实例,则执行可以是并行化和矢量化的:不遵守函数体边界,用户代码可能会以任意方式重叠和组合(特别是,这意味着用户提供的可调用对象不得获取互斥锁来访问共享资源)。
[编辑] 示例
reduce 是 std::accumulate 的乱序版本
运行此代码
#include <chrono> #include <experimental/execution_policy> #include <experimental/numeric> #include <iostream> #include <numeric> #include <vector> int main() { std::vector<double> v(10'000'007, 0.5); { auto t1 = std::chrono::high_resolution_clock::now(); double result = std::accumulate(v.begin(), v.end(), 0.0); auto t2 = std::chrono::high_resolution_clock::now(); std::chrono::duration<double, std::milli> ms = t2 - t1; std::cout << std::fixed << "std::accumulate result " << result << " took " << ms.count() << " ms\n"; } { auto t1 = std::chrono::high_resolution_clock::now(); double result = std::experimental::parallel::reduce( std::experimental::parallel::par, v.begin(), v.end()); auto t2 = std::chrono::high_resolution_clock::now(); std::chrono::duration<double, std::milli> ms = t2 - t1; std::cout << "parallel::reduce result " << result << " took " << ms.count() << " ms\n"; } }
可能的输出
std::accumulate result 5000003.50000 took 12.7365 ms parallel::reduce result 5000003.50000 took 5.06423 ms
[编辑] 另请参阅
对一个范围的元素进行求和或折叠 (函数模板) | |
对一个范围的元素应用函数,并将结果存储在目标范围中 (函数模板) | |
(并行 TS) |
应用函数对象,然后乱序归约 (函数模板) |