看板 Linux 關於我們 聯絡資訊
https://www.slothparadise.com/running-mpi-common-mpi-troubleshooting-problems/ https://i.imgur.com/pKWdhds.jpg
也遇到這個網站貼一個問題 已經照他的建議操作 但是還是有一樣的error 我懷疑是library沒辦法在各個nodes 共用 想請問有人有類似經驗 很需要幫忙 謝謝 可以再私訊詳述問題 麻煩了 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.43.159.108 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Linux/M.1648045641.A.617.html
ryan0903: 總共有6個nodes 但是只能利用其中一個 也就是指令只能 03/23 22:31
ryan0903: 是#PBS -l nodes=1:ppn=40 最多 03/23 22:31
relaughter: 每個節點彼此都要能免密碼登入,這點確定了嗎? 03/23 23:02
ryan0903: 有的 感謝提醒 還有什麼要注意的嗎 03/24 00:13
giraffe4527: 每個節點防火牆、selinux都關掉,可以輸出PBS的log 03/24 00:22
giraffe4527: 可以試試看在每個節點跑mpirun確認是不是submit問題 03/24 00:25
giraffe4527: 再來把.ssh/known_hosts節點清掉排除hosts key問題 03/24 00:28
CardLin: 沒有 InfiniBand 多節點也只是無用的技術。 03/25 01:28
CardLin: 跨節點建議 /home 及 /opt 用 NFS 分享,ssh key放/home 03/25 01:30
CardLin: 另外建議用 PIC 編譯所有的程式碼。 03/25 01:34
CardLin: 因為 PIC 會影響分支預測的準確率。 03/25 16:46
pillbox1989: 一般建立mpi時,會用nis在每個節點建立相同的使用者 03/25 18:59
pillbox1989: 代號。若要用ssh方式,要使用ssh_keygen做出金鑰對放 03/25 18:59
pillbox1989: 到各節點 03/25 18:59
giraffe4527: 其實nis+nfs共享home就不用每個節點丟key了 03/26 10:46
giraffe4527: 放到head node自己的auth key就每個節點通用 03/26 10:46
giraffe4527: 不然很多台每個使用者每台都要做一次真的累 03/26 10:46
giraffe4527: 但就是平行時比較吃網路 03/26 10:48