作者sinlin (新生活!~)
看板Linux
標題[問題] 使用condor系統如何submit平行運算
時間Sat Feb 27 23:46:35 2010
在unix中管理job的分配有一套叫做condor的系統
如果要丟job到server讓它找你分配cpu來運算,
通常都是使用condor_submit condor.sh
condor.sh是一個shell script大致如下:
universe = vanilla
initialdir = /home/u8/users/burkardt/phoenix_test
executable = foo.sh
log = foo.log
output = foo.output
queue
如果今天在我要跑的job裡面,如上面的foo.sh
有執行了一個套裝軟體(gromacs)內好幾個不同的指令,
只有其中一行是要做平行運算的:
grompp_d xxxxxx
mpirun -np 8 mdrun_mpi_d xxxxxxx
trjconv_d xxxxxxxxx
如上面三行,只有中間一行的指令是做平行運算
這樣子要丟job到condor系統
我把condor.sh改成
universe = MPI
initialdir = /home/u8/users/burkardt/phoenix_test
executable = foo.sh
log = foo.log
output = foo.output
machine_count = 8
queue
然後用condor_submit condor.sh去執行,得不到輸出檔
我也上網去查一些範例,關於MPI的submit,看到的都是單一執行檔
如C語言的xxx.c 或fortran的 xxx.f
可是我要submit的是shell script而且裡面都是commend不是code,
這些commend還是單機還平行的各佔一部份
請問有人知道怎麼樣submit這種shell script到condor系統中呢?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.109.103.226
推 chiouss:condor 貴單位應該有不少高手吧...怎麼會在這邊問呢? :p 02/28 00:21
→ sinlin:找不到人問,大家使用需求不同 = = 02/28 00:44
推 randle:foo.sh檔案的執行權限? 02/28 01:01
→ sinlin:-rwxr-xr-x 應該不是這個東西的問題,是嗎 @@ 02/28 01:15
→ randle:那把foo.sh裡的指令全都寫成絕對路徑? 02/28 10:38
→ sinlin:試了,無效....不過還是謝了 02/28 18:10
推 sunneo:也許你要看看state,說不定一直pending 03/01 00:38
→ sunneo:輸出err看看 03/01 00:42
→ sinlin:輸出err一直是空白 XD out也是一樣 03/01 19:58