看板 Linux 關於我們 聯絡資訊
各位好,小弟前陣子為了做ML買了張3090,順便重裝了ubuntu 22.04 結果常常播影片(yt,twitch)瀏覽器就會跳SIGKILL,桌面也時不時出現System program pro blem Detected 覺得可能是22.04太新,所以最近重新安裝了20.04 沒想到問題不但沒解決,還開始會突然當機,連用pip安裝個套件都要重複執行好幾次才能 成功(中間一直出現segmentation fault) 想問一下有沒有人遇過類似問題? 初步懷疑是顯卡,因為當機只發生在用gui時,平常ssh回來都沒事 但平常用windows玩遊戲也沒有當機過 電腦配置 CPU: AMD R5-3600 MB: ASUS TUF B450-Pro RAM: 美光 3200 8G*2 GPU: EVGA RTX3090 FTW3 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.233.144.87 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Linux/M.1677074498.A.C88.html
holishing: nvidia 顯卡驅動是裝哪一款的? nouveau 還是官方的?02/22 22:52
holishing: 平常用桌面時也可以開個終端機輸入 journalctl -f 後02/22 22:53
holishing: 掛著,有機會在出問題時馬上看到錯誤訊息02/22 22:54
eric0221: 因為要裝 CUDA 所以裝官方的,我再試試看能不能發現02/23 00:52
eric0221: error 在哪,感謝02/23 00:52
剛又卡了一次 看起來是遇到Deadlock? Message from syslogd@RTX3090 at Feb 23 02:09:47 ... kernel:[ 2028.220280] watchdog: BUG: soft lockup - CPU#3 stuck for 22s! [Thread PoolForeg:7682] Message from syslogd@RTX3090 at Feb 23 02:09:47 ... kernel:[ 2028.220280] watchdog: BUG: soft lockup - CPU#2 stuck for 47s! [msedge :7405] Message from syslogd@RTX3090 at Feb 23 02:09:47 ... kernel:[ 2028.224280] watchdog: BUG: soft lockup - CPU#4 stuck for 47s! [Thread PoolForeg:8184] Message from syslogd@RTX3090 at Feb 23 02:09:47 ... kernel:[ 2028.236280] watchdog: BUG: soft lockup - CPU#10 stuck for 47s! [Threa dPoolForeg:8183] Message from syslogd@RTX3090 at Feb 23 02:09:51 ... kernel:[ 2032.216262] watchdog: BUG: soft lockup - CPU#1 stuck for 22s! [Thread PoolForeg:7657] Message from syslogd@RTX3090 at Feb 23 02:09:51 ... kernel:[ 2032.232262] watchdog: BUG: soft lockup - CPU#7 stuck for 48s! [Thread PoolForeg:8243] ※ 編輯: eric0221 (118.233.144.87 臺灣), 02/23/2023 02:13:45
changchichun: 好奇問一下 你只有這一張顯卡嗎?如果讓這張309002/23 09:24
changchichun: 只做運算,平常顯示用onboard 顯卡呢?02/23 09:24
只有這張卡 cpu也沒內顯…
hizuki: UEFI microcode更新否?這故障很嚴重啊02/23 10:33
是直接更新bios嗎
johnjohnlin: 3600是不是有可能有低負載bug,可以檢查看看02/23 13:25
johnjohnlin: 如果是2019/7就買的,機率頗高02/23 13:27
確實是2019/7買的 ※ 編輯: eric0221 (140.112.41.117 臺灣), 02/23/2023 14:35:50 ※ 編輯: eric0221 (140.112.41.117 臺灣), 02/23/2023 14:44:11
eric0221: 剛更新bios完好像沒事了 居然忘了還有這要更新 02/23 16:45
hizuki: 如j氏所講的bug基本上更新UEFI就能解決 02/27 16:03