当前位置: 首页 > 并行计算基础 > 正文

并行程序设计—MPI

什么是MPI ?

官方文档:https://computing.llnl.gov/tutorials/mpi/#Abstract

http://mpi-forum.org/docs/

M P I = Message Passing Interface. 消息传递接口

MPI is a specification for the developers and users of message passing libraries. By itself, it is NOT a library – but rather the specification of what such a library should be.

MPI 是一种特殊的提供给开发者和用户的库,就他自己而言,它本身不是一个库,而是规定如何调用的规则。

程序模型:

Originally, MPI was designed for distributed memory architectures, which were becoming increasingly popular at that time (1980s – early 1990s).

最早,MPI 当时是为非常受欢迎的分布式内存架构设计的。

distributed_mem

As architecture trends changed, shared memory SMPs were combined over networks creating hybrid distributed memory / shared memory systems.

随着架构的变化,共享内存模式SMP 包括由网络连接的混合分布式内存结构,和共享内存结构。

MPI implementors adapted their libraries to handle both types of underlying memory architectures seamlessly. They also adapted/developed ways of handling different interconnects and protocols.

MPI 也是应多种内存结构的类型,并且同样适用不同的协议。

hybrid_mem

Today, MPI runs on virtually any hardware platform:

  • Distributed Memory
  • Shared Memory
  • Hybrid

今天MPI 工作在多种硬件平台上,包括分布式平台,共享内存平台,混合架构平台。

Reasons for Using MPI:

Standardization – MPI is the only message passing library that can be considered a standard. It is supported on virtually all HPC platforms. Practically, it has replaced all previous message passing libraries.
Portability – There is little or no need to modify your source code when you port your application to a different platform that supports (and is compliant with) the MPI standard.
Performance Opportunities – Vendor implementations should be able to exploit native hardware features to optimize performance. Any implementation is free to develop optimized algorithms.
Functionality – There are over 430 routines defined in MPI-3, which includes the majority of those in MPI-2 and MPI-1.
Most MPI programs can be written using a dozen or less routines

使用MPI 的原因:标准化     可移植性      多样化       多功能

历史版本:

  • 1995   MPI 1.1
  • 1997   MPI 1.2
  • 2008   MPI 1.3
  • 2008   MPI-2.1
  • 2009   MPI-2.2
  • 2015   MPI-3.1

平台标准:

  • MVAPICH – Linux clusters
  • Open MPI – Linux clusters
  • IBM MPI – BG/Q clusters

环境安装

我使用的是fedora 22 使用了阿里的软件源。直接使用yum install mpich.noarch  然后就接着使用yum  安装就行了。

这里有一段测试代码。

这是基于C 的代码,所以使用mpicc 编译本质上使用的是GCC,用法也一样,执行使用mpicrun -np [number] 来执行。

假设我们创建10个进程来执行这段代码。

这段代码现在的意义是创建10个进程内部使用0开始作为进程的编号,然后打印本机名和进程编号,0号进程单独打印。

执行代码:  mpirun -np 10 ./a.out

2017-01-20 15-51-23 的屏幕截图

结果如上。

这还没有使用MPI 核心的消息传递功能,接着我们使用MPI的消息传递功能。

这个程序使用一个进程接受消息,其余进程发送消息的方式工作。

2017-01-20 16-21-56 的屏幕截图

我们需要介绍几个概念与函数接口:

通信子:一组可以互相发消息的集合。MPI_init 的其中的一个目的,就是在用户启动的时候,定义由用户启动的所有进程所组成的通信子。名字就是MPI__COMM_WORLD 。其中我们可以使用

MPI_Comm_size(MPI_COMM_WORLD,&comm_sz);
MPI_Comm_rank(MPI_COMM_WORLD,&my_rank);

这两个函数来获取其中的信息。

SPMD程序,我们现在的模式叫做单指令多数据并行。

接着我们来看看MPI 的两个核心函数,SEND 和 RECV。

我们从men 手册中获取文档

2017-01-20 16-35-45 的屏幕截图

第一个参数是包含消息内容的指针,第二个表示发送的数据量,第三个是数据类型。第四个指定了要接受消息的进程的进程号,第五个参数是用来区分看上去一样的消息,一般是一个非负数。最后一个参数是一个通信子,所有涉及通信的MPI的函数都需要一个通信子最重要的目的之一是指定通信的范围。

2017-01-20 16-44-14 的屏幕截图

这几个参数类似,前三个用于指定接受消息的内存,后面的三个参数用来识别消息。最后一个参数大部分情况下不使用。

消息匹配规则

  1. recv_type = send_type. 同时recv_buf >= send_buf_sz, 这是基本规则。
  2. 发送的消息和接受的要在编程时就配对设计。
  3. 消息发送后依据数据量的大小决定返回时机。
  4. 消息不可超越,原因是MPI不能对网络性能有强制的要求。
  5. 合理的设计避免“悬挂陷阱”。
  6. 无接受的消息最终将会被丢弃。

本文固定链接: http://zmrlinux.com/2017/01/20/%e5%b9%b6%e8%a1%8c%e7%a8%8b%e5%ba%8f%e8%ae%be%e8%ae%a1-mpi/ | Kernel & Me

该日志由 root 于2017年01月20日发表在 并行计算基础 分类下, 你可以发表评论,并在保留原文地址及作者的情况下引用到你的网站或博客。
原创文章转载请注明: 并行程序设计—MPI | Kernel & Me
【上一篇】
【下一篇】