看板 Linux 關於我們 聯絡資訊
大家好 小弟的實驗室是使用Gaussian09進行化學上的科學研究, 為了計算上的效率,實驗室歷年來都是使用Opensuse系列進行計算。 今年5月的時候我們實驗室採購一台R7 1700 ,起初我轉用ubuntu17.04, 但在使用半年多之後開始出現運算突然中止的情況, 計算中的文件也沒出現任何的錯誤訊息, 這問題就算換成Opensuse的tumbleweed也有出現。 我也有嘗試在計算中查看CPU的溫度,發現都在40度左右。 我發現不管是在ubuntu及tumbleweed下,都是在使用一段時間之後才出現這個問題, 我想問板上的大家還有什麼方向可以找出問題的解決方法? PS:如果需要列出硬體配備的話我得要找出採購單才行。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 120.107.165.153 ※ 文章網址: https://www.ptt.cc/bbs/Linux/M.1512961407.A.BE5.html
galic: 電蝦的那張單就是你阿 XD 12/11 13:01
galic: 是沒多有用的意見啦 但更新bios看看 12/11 13:01
hizuki: 檢查ECC記憶體,我發現有問題的時候ECC型故障時候不會上報 12/11 17:36
hizuki: ,但是系統會故障 12/11 17:36
可是我的記憶體是金士頓 16G DDR4-2400 HyperX FURY(黑) 這條不是ECC @@ ※ 編輯: powernba (120.107.165.153), 12/11/2017 19:22:19
hizuki: 那不是這個原因了,麻煩開啟程式log看是不是記憶體不夠了 12/11 20:43
Adama: 跑一半出問題 先測memtest86+和PSU準沒錯 12/11 20:47
我發現我之前沒有分割swap,所以我就重新調整磁區,將原本的"/tmp"併入"/" 。 調整前: /home、/、/efi/boot、/tmp 調整後: /home、/、/efi/boot、swap 現在正在運算測試中,暫時還沒有問題出現.... ※ 編輯: powernba (120.107.165.153), 12/12/2017 12:50:43