→ ryan0903: 總共有6個nodes 但是只能利用其中一個 也就是指令只能 03/23 22:31
→ ryan0903: 是#PBS -l nodes=1:ppn=40 最多 03/23 22:31
推 relaughter: 每個節點彼此都要能免密碼登入,這點確定了嗎? 03/23 23:02
→ ryan0903: 有的 感謝提醒 還有什麼要注意的嗎 03/24 00:13
→ giraffe4527: 每個節點防火牆、selinux都關掉,可以輸出PBS的log 03/24 00:22
→ giraffe4527: 可以試試看在每個節點跑mpirun確認是不是submit問題 03/24 00:25
→ giraffe4527: 再來把.ssh/known_hosts節點清掉排除hosts key問題 03/24 00:28
推 CardLin: 沒有 InfiniBand 多節點也只是無用的技術。 03/25 01:28
→ CardLin: 跨節點建議 /home 及 /opt 用 NFS 分享,ssh key放/home 03/25 01:30
→ CardLin: 另外建議用 PIC 編譯所有的程式碼。 03/25 01:34
→ CardLin: 因為 PIC 會影響分支預測的準確率。 03/25 16:46
→ pillbox1989: 一般建立mpi時,會用nis在每個節點建立相同的使用者 03/25 18:59
→ pillbox1989: 代號。若要用ssh方式,要使用ssh_keygen做出金鑰對放 03/25 18:59
→ pillbox1989: 到各節點 03/25 18:59
→ giraffe4527: 其實nis+nfs共享home就不用每個節點丟key了 03/26 10:46
→ giraffe4527: 放到head node自己的auth key就每個節點通用 03/26 10:46
→ giraffe4527: 不然很多台每個使用者每台都要做一次真的累 03/26 10:46
→ giraffe4527: 但就是平行時比較吃網路 03/26 10:48