실시간 모니터링 시스템 구축 사례와 경험 공유

무신사 O4O 엔지니어링 팀은 최근 설 연휴 동안 Claude Code Agent Teams를 활용하여 실시간 모니터링 시스템을 반나절 만에 성공적으로 구축했습니다. 이 과정에서 발생한 데이터 정합성 이슈를 해결하기 위해 팀은 머신러닝 기반의 AI 코딩 에이전트를 적극적으로 활용하였습니다. 본 글에서는 구축 과정에서의 경험을 통해 AI 도구의 실용성과 효율성을 공유하고자 합니다.

효율적인 문제 해결을 위한 실시간 모니터링

최근 설 연휴 동안 무신사의 매장에서 특정 상품의 결제가 되지 않는 이슈가 발생했습니다. 그 원인은 바코드와 옵션 간의 중복이었습니다. 고객이 결제 시 사용하는 POS 시스템은 유효하지 않은 데이터를 참조하여 결제가 실패하는 상황이 발생했습니다. 이 문제는 원천 시스템에서 불필요한 데이터를 삭제함으로써 즉시 해결되었지만, 더 큰 문제는 다른 매장에서도 같은 상황이 발생할 가능성이 높다는 것이었습니다. 이에 따라 O4O 팀은 반복적으로 발생할 수 있는 데이터 정합성 문제를 예방하기 위해 전수 조사를 시작했습니다. 그러나 기존의 데이터 접근 방식은 시간 소요가 큰 한계가 있었습니다. 매장별로 수작업으로 쿼리를 작성하고 결과를 확인하는 과정이 반복되었기 때문입니다. 이때 팀은 Claude Code의 Agent Teams를 통해 자동화된 실시간 모니터링 시스템을 구축하기로 결심했습니다. 이러한 접근 방식은 기존의 비효율적인 작업 방식을 타파하고, 매장 운영의 효율성을 크게 향상시킬 수 있는 기회를 제공했습니다.

Claude Code Agent Teams의 활용

Agent Teams는 문제 해결을 위한 발판을 제공하는 중요한 도구로 작용했습니다. 리드 에이전트와 독립된 워커 에이전트 간의 협력을 통해 BE와 FE 두 코드베이스를 동시에 구축하는 것이 가능해졌습니다. 리드 에이전트는 기존 코드 패턴을 분석하고 API 계약을 정의한 뒤, 병렬로 워커 에이전트를 실행하는 구조로 작업을 진행했습니다. 이 과정에서 필수적으로 진행된 단계는 두 코드베이스의 패턴 분석과 API 계약 정의입니다. 리드 에이전트는 BE와 FE의 구조를 연구하여 기존 코드 스타일에 맞는 API 계약을 수립했습니다. 이러한 Contract-First 접근 방식은 두 코드베이스가 서로 독립적이며 언제든지 호환될 수 있도록 보장하는 역할을 하였습니다. 그 후, 사용자 검토를 거쳐 BE와 FE 워커가 동시에 작업을 시작했습니다. 이는 작업 효율성을 극대화하고, 기존 스프린트의 조정 없이도 신속하게 구축할 수 있는 방법으로 효과를 발휘했습니다.

결과 및 향후 발전 방향

설 연휴 동안 진행된 프로젝트의 결과로는 약 반나절 만에 실시간 모니터링 대시보드를 완성하게 되었습니다. 이 대시보드는 총 27개 파일과 약 2,800줄의 코드로 구성되며, 매장 데이터의 정합성을 실시간으로 확인할 수 있는 기능을 갖추었습니다. 이러한 시스템을 통해 매장 방문자가 문제가 발생하기 전에 잠재적인 이슈를 사전에 탐지하고 해결할 수 있게 되었습니다. 향후에는 Agent Teams의 활용 범위를 더욱 넓혀, 다양한 운영 이슈를 효율적으로 해결해 나갈 계획입니다. AI 코딩 에이전트를 통해 더 많은 반복 작업을 자동화하고, 팀의 생산성을 높인 경험을 바탕으로 데이터 정합성과 관련된 다양한 도전 과제를 해결할 것입니다. AI 도구를 적재적소에 활용하여, 개발 시간이 단축되고 시스템 안정성이 향상되는 방향으로 나아가겠습니다.

무신사 O4O 엔지니어링 팀은 온라인과 오프라인 간의 통합 경험을 제공하는 데 기여하며, 이러한 경험이 다른 팀과 조직에도 유용한 참고가 되길 바랍니다.

이 블로그의 인기 게시물

매크로 코딩으로 시니어 성장의 벽 넘기

무신사머니 결제 시스템 연동의 안정성 및 혁신

AI와 사람의 협업을 위한 VLMOps 어드민 구축기