LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
楼主: youbest

[原创]源代码搭建应用(一)——动手搭建自己的计算集群系统

[复制链接]
发表于 2008-3-3 23:32:36 | 显示全部楼层
我架设的GRID系统主要是试验性质的,探讨几个计算中心联合提供远程服务
的可行性,我们这次的试验主要由6个大学(研究所)各自提供一部分计算资源
构筑GRID系统,然后结合在一起,我们这一点下又又有三个子群,120个节点的由我来构筑,还有把3个子群结合到一起的也主要我来做。至于把6个处点结合到一起则是由这个GRID
系统的开发组织来做。

另外,我只利用主集群的大约不到五分之一,
主集群(655节点)是大学的超级计算机系统,现在大约在top500的10位左右吧。
peak 性能大约100T吧,Linpack夏天测是接近60T,最近增加了一些
节点(集群2),另外主系统的浮点加速器,编译器,IB驱动等也更新了,
估计成绩能有提高,3月底停机测试和年度维护,在全部停机前的3天,一部分
120节点拿来做这个试验,留给我实机设定GRID系统时间只有一天,另两天
结合、提交任务测试,现在我在设定控制节点以及计算节点实际设定的工具准备。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-3-4 08:27:52 | 显示全部楼层
看起来很不错,方便的话有什么经验和大家分享一下吧。
回复 支持 反对

使用道具 举报

发表于 2008-3-4 19:45:48 | 显示全部楼层
朋友说用 OSCAR 来做。
我想用全编译的。
回复 支持 反对

使用道具 举报

发表于 2008-3-4 20:11:49 | 显示全部楼层
各位都是做什么工作的?

先说一下我自己吧,
我是学物理出身的,
后来搞计算物理/化学,毕业后在大学里做了3年,
正式职位没什么希望,就到公司里了,

先是做了半年的benchmark(在矢量计算机上)
然后在超级计算机上做了半年用应用(计算过程自动控制方面)

现在在一个团队管理超级计算机集群,也作技术支持。
回复 支持 反对

使用道具 举报

发表于 2008-3-20 15:47:50 | 显示全部楼层
我已经按照豹老师的方法做得差不多了,我想知道如何实现 PXE 网卡启动安装编译好的系统。
OSCAR可以实现这样的功能,OSCAR里面也有 openmpi 这个软件。
回复 支持 反对

使用道具 举报

发表于 2008-3-20 15:48:47 | 显示全部楼层
我已经按照豹老师的方法做得差不多了,我想知道如何实现 PXE 网卡启动安装编译好的系统。
OSCAR可以实现这样的功能,OSCAR里面也有 openmpi 这个软件。但是,它太自动了,我需要手工干预的。我需要用 rsync 或者 scp 将编译好的系统拷贝到目标机器上。而且暂时需要双系统共存。

如果不用PXE网卡启动,那需要将机器从机架上抽出挂上光驱。估计一台机器就弄上半天时间。
回复 支持 反对

使用道具 举报

发表于 2008-3-30 18:07:45 | 显示全部楼层
请教豹老师,这样是不是表示已经成功了?

----------------------------------------------------

root@control-node^examples^# mpirun /opt/shared/test/hello_c
--------------------------------------------------------------------------
Failed to find or execute the following executable:

Host:       mpi-node2
Executable: /opt/shared/test/hello_c

Cannot continue.
--------------------------------------------------------------------------
--------------------------------------------------------------------------
Failed to find or execute the following executable:

Host:       mpi-node1
Executable: /opt/shared/test/hello_c

Cannot continue.
--------------------------------------------------------------------------
回复 支持 反对

使用道具 举报

发表于 2008-3-31 10:40:41 | 显示全部楼层
请教豹老师:

  如果我这个并行计算集群做成了,如何在控制节点上运行应用软件呢?直接运行?不做任何设置吗?如果需要设置,又是怎样的呢?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表