Parallel Computing Toolbox

使用工具箱和 MATLAB Distributed Computing Server 实现数据并行应用程序

Parallel Computing Toolbox 中的分布式数组是特殊的数组,此类数组可容纳的数据量是台式计算机的内存 (RAM) 可容纳的数据量的若干倍。分布式数组跨计算机群集上运行的多个 MATLAB worker 进程来分配数据(使用 MATLAB Distributed Computing Server)。因此,通过分布式数组,可以克服台式计算机的内存限制,解决需要操作特大矩阵的问题。

通过可用于操作分布式数组的 150 多个函数,您可以像 MATLAB 数组那样与这些数组进行交互,并且可以在 worker 上远程操作可用的数据,而无需进行低级的 MPI 编程。可用的函数包括基于 ScaLAPACK 的线性代数例程,如 mldivide(也称作反斜杠运算符 (\))、luchol,以及用于与 MAT 文件之间移动分布式数据的函数。

为了对并行化方案进行细粒度的控制,该工具箱提供了单程序多数据 (spmd) 构造和基于 MPI 标准库 (MPICH2) 的多个消息传递例程。使用 spmd 结构,可以指定代码区段,跨参与并行计算的 worker 并发运行。程序执行过程中,spmd 会自动将在其内部使用的数据和代码传输给 worker,并在执行完毕后将结果返回给 MATLAB 客户端会话。用于发送、接收、广播、阻挡、以及探测操作的消息传递函数均可用。

使用分布式数组进行编程。利用分布式数组和并行算法,仅需对代码做最少的更改即可创建数据并行的 MATLAB 程序,且无需使用 MPI 编程。

使用分布式数组进行编程。利用分布式数组和并行算法,仅需对代码做最少的更改即可创建数据并行的 MATLAB 程序,且无需使用 MPI 编程。

下一页: 以交互方式和作为批处理作业运行并行应用程序

试用 Parallel Computing Toolbox

获取试用版软件

Machine Learning with MATLAB

观看网上技术交流会录像