|
搭建linux集群,系统是fedora,电脑是4核的,CPU是intel core ,主频2.5,内存为4G,一共十台电脑,百兆交换机。
我从网上下的是hpl-2.0.tar.gz,以及blas.tgz。
做一台测试时,N=10000,NB=64,P=1,Q=4,但是得到的结果只有0.8GFlops左右。。。。。。
就算是把N提高,把NB减低,提高的也是很有限的。
十台电脑做测试时,大概提高10倍左右吧。
我想请问一下这个什么原因造成的啊?我搭建平台都是从网上找的资料,自己不怎么懂。
是用的blas的问题吗?看到有的资料上说是用ATLAS的,但是会差这么多吗?
我在vista平台下用虚拟机安装redhat9.0也试过,可以到2.3GFlops左右.
但是理论峰值=2*主频*CPU数,还是差很多啊。。。。。
我的问题出在什么地方啊?麻烦谁能帮帮我!!! |
|