GStreamer는 정상인데 왜 수신이 실패했나: 로봇 WebRTC 장애를 경계로 분해한 디버깅

2023년 2월 1일 · ◷ 2분

실시간 스트리밍 문제는 “안 된다"로 시작하면 끝이 없다. 특히 로봇 영상 파이프라인은 네트워크, 코덱, 프로토콜, 서버 정책이 동시에 얽혀 있어 한 번에 고치려 하면 더 느려진다.

이번 글은 GStreamer 송신은 되는데 서버에서 거부되는 상황에서 어떻게 원인을 좁혀갔는지 기록한 트러블슈팅 노트다.

증상

당시 관찰한 핵심 증상은 두 가지였다.

즉, “로봇 송신 코드가 완전히 틀렸다"보다 서버 경계에서 요구하는 연결 조건을 충족하지 못했다 쪽이 더 유력했다.

문제를 세 가지 축으로 쪼갰다.

이렇게 나누면 “어디가 문제인지 모른다"가 아니라 “어느 축에서 실패하는지"를 확인할 수 있다.

실무에서 유효했던 신호는 아래였다.

정리하면, RTP를 쏘는 것과 WebRTC 경로에 정합하게 연결되는 것은 다른 문제였다.

당시 정리한 대응 순서는 이렇다.

핵심은 기능을 더 붙이는 것이 아니라, 경계를 분리해 디버깅 가능한 상태를 만드는 것이었다.

장애가 끝난 뒤 반드시 아래 항목을 남겼다.

이 템플릿이 있어야 다음 장애에서 “추측” 대신 “비교"가 가능해진다.

이 이슈에서 가장 큰 교훈은 다음이다.

참고: Mediasoup 문서는 Transport 연결 절차와 시그널링 분리 원칙을 상세히 설명한다. Communication Between Client and Server

참고: WebRTC 표준은 ICE/DTLS/SRTP를 포함한 종단 간 연결 성립 조건을 정의한다. WebRTC 1.0

참고: GStreamer 문서는 파이프라인 단위로 인코딩/전송 문제를 분리 진단할 때 기본 레퍼런스다. GStreamer Documentation