|

楼主 |
发表于 2004-4-12 10:08:36
|
显示全部楼层
log就是你说的屏幕输出后定向到的文件,也是你说的定期缩减log
我在调试fortran+mpi的并行程序,对方没有并行调试器,而我根据出错信息没法找到出错地点,现在只好利用打印一步步的缩小出错范围,比如我怀疑tracing子程序有问题,那么就在这之前加print*,'s'调后加print*,'e',如果s出来e没出来,则这个有问题,再进一步缩小范围查找。
没办法:现在我的MSN名字都变成
飞鸢:靠打印逐步调试并行程序,从没这么弱智过 
以下是我的程序的出错信息,有了解这些的,还请帮忙,谢谢!
程序f90+mpi的,运行在
CPU: Alpha
操作系统:Digital unix V4.0 878 alpha
FORTRAN:Digital Fortran 90 V4.0-1
MPI:mpich 1.2.1
编译命令:
f90 -g -non_shared -lmpich -lSZ3 -o sem semmpi.f90
程序出错:
trap:user program exception, pe_num=26:0
exc_type=5 exc_code=fffffffffffffffa exc_subcode=0
forrtl: info: Fortran error message number is 65.
PC=12009f5c8 RA=12009ed00 A0=fffffffffffffffa A1=0 A2=56
forrtl: warning: Could not open message catalog: for_msg.cat.
forrtl: info: Check environment variable NLSPATH and protection of /usr/lib/nls/msg/en_US.ISO8859-1/for_msg.cat.
forrtl: error (65): Message not found
dis -S myprogram后的文件部分对应如下:
0x12009f5a4: 2dae005e ldq_u s4, 94(s5)
0x12009f5a8: 49b402cd extwl s4, a4, s4
0x12009f5ac: f280091d blbs a4, 0x1200a1a24
0x12009f5b0: 49a6172d sll s4, 0x30, s4
0x12009f5b4: 41310649 s8addq s0, a1, s0
0x12009f5b8: 49a6178d sra s4, 0x30, s4
0x12009f5bc: b5af0938 stq s4, 2360(s6)
0x12009f5c0: 204f0208 lda t1, 520(s6)
0x12009f5c4: 47e0340c bis zero, 0x1, s3
0x12009f5c8: 47e03411 bis zero, 0x1, a1 此处出错
0x12009f5cc: 21290178 lda s0, 376(s0)
我看不出来是哪里出了问题,能否告诉上面那些出错信息对应的是什么,谢谢!
|
|