728x90
반응형
DEMO 코드 돌릴려고 하는데 갑자기 GPU FAN ERROR가 떴다 ㅜㅜ
GPU Fan ERROR은 보통 온도가 급격히 올라갈 때 생긴다고 한다.
Reboot을 하면 문제를 해결할 수 있다고 해서 편하게 Reboot을 하려고 했다.
sudo reboot
하지만 끝나고 나니....
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
GPU Driver가 로드가 되지 않았다.
문제를 살펴보니 GPU를 끄지않고 reboot을 하면 종종 그렇다고 한다...
인터넷을 통해 문제를 잘 해결할 수 있었다!
apt --installed list | grep nvidia-driver
다음을 통해 nvidia 버전을 확인!
sudo apt-get purge '^nvidia-.*'
기존 드라이버 제거
sudo apt-get autoremove
sudo apt-get autoclean
기존 패키지의 의존성 문제 해결 (만약 2개 이상 설치되어있다면)
sudo apt-get install nvidia-driver-<$version>
원하는 버전 설치
sudo reboot
다시 재부팅
대학원 서버가 에러나면 어떻게든 고칠려고해서 더 망가지는 경우도 있지만... 왜 이렇게 힘들까..
코드 돌리다가 Fan이 ERR!난 이유는 무엇일가?? 심지어 코드도 에러났는데... ㅜㅜ
728x90
반응형
'CS 지식 정리 > 개발기록' 카테고리의 다른 글
Terminal에서 Tmux 이전 페이지로 올려서 확인하는 방법 (0) | 2024.07.31 |
---|---|
파이썬 로그 파일 남기기 (1) | 2024.06.16 |
[python] fire 패키지 (0) | 2024.05.09 |
'wget'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는배치 파일이 아닙니다. (0) | 2023.11.26 |
[python] hasattr(object, attribute) object에 attribute 속성이 있는지 참/거짓 여부 (0) | 2023.11.12 |
댓글