카테고리 없음

PyTorch 오류 해결 방법 "RuntimeError: Function AddmmBackward returned an invalid gradient."

개발자의 잡동사니 2023. 4. 29. 08:11

※ 이 글은 필자가 개인적으로 공부하면서 정리한 글이기 때문에, 잘못된 정보가 포함되어 있을 수 있습니다. ※

 

※ 오류 상황 ※

 

  아래 오류는 PyTorch 프레임워크를 이용하여 CNN 분류 모델의 학습 코드를 돌릴 때 마주쳤던 오류다.

 

  ▶ 오류 메시지: "RuntimeError: Function AddmmBackward returned an invalid gradient."

 

 

※ 오류 발생 원인 ※

 

  일반적으로 CNN에서는 convolutional layers에 기반한 feature extractor에서 나온 결과를 flatten한 뒤에 (벡터로 변경한 뒤에) linear layer의 입력으로 넣는다. 다만 이때, flattened dimension과 linear layer의 input dimension이 서로 다를 때 발생할 수 있는 오류다.