카테고리 없음
PyTorch 오류 해결 방법 "RuntimeError: Function AddmmBackward returned an invalid gradient."
개발자의 잡동사니
2023. 4. 29. 08:11
※ 이 글은 필자가 개인적으로 공부하면서 정리한 글이기 때문에, 잘못된 정보가 포함되어 있을 수 있습니다. ※
※ 오류 상황 ※
아래 오류는 PyTorch 프레임워크를 이용하여 CNN 분류 모델의 학습 코드를 돌릴 때 마주쳤던 오류다.
▶ 오류 메시지: "RuntimeError: Function AddmmBackward returned an invalid gradient."

※ 오류 발생 원인 ※
일반적으로 CNN에서는 convolutional layers에 기반한 feature extractor에서 나온 결과를 flatten한 뒤에 (벡터로 변경한 뒤에) linear layer의 입력으로 넣는다. 다만 이때, flattened dimension과 linear layer의 input dimension이 서로 다를 때 발생할 수 있는 오류다.