Sierra: ClickHouse로 옵저버빌리티와 분석을 하나로 연결하다
Sierra: ClickHouse로 옵저버빌리티와 분석을 하나로 연결하다

Sierra: ClickHouse로 옵저버빌리티와 분석을 하나로 연결하다

ClickHouse 분류
Customer Story
Type
Introduction
작성자

Ken

원문: How Sierra uses ClickHouse to bridge observability and analytics

수년간 옵저버빌리티(Observability)와 분석(Analytics)은 서로 다른 두 개의 섬처럼 존재해왔다. 한쪽에서는 SRE와 DevOps 팀이 시스템 상태를 모니터링하고 알람을 설정하고 실시간으로 인시던트에 대응한다. 다른 한쪽에서는 데이터 분석가가 대시보드를 만들고, A/B 테스트를 돌리고, 비즈니스 성과를 예측한다.

Sierra의 소프트웨어 엔지니어 Arup Malakar는 이 구분이 더 이상 의미가 없다고 말한다. 같은 이벤트 스트림을 두 가지 시선으로 보는 것일 뿐인데, 왜 두 개의 독립된 스택, 두 개의 파이프라인, 두 개의 대시보드를 유지해야 하는가?

결국 모든 것은 데이터입니다. 우리에게 필요한 건 그 데이터에 접근할 수 있는 방법뿐이죠. — Arup Malakar, Software Engineer, Sierra

이 글은 ClickHouse 2025 Open House 컨퍼런스에서 Arup이 공유한, AI 기반 고객 경험 플랫폼 Sierra가 ClickHouse 하나로 실시간 옵저버빌리티와 비즈니스 분석을 모두 운영하는 방식에 관한 이야기다.

AI-First 고객 경험을 위한 기반

Sierra는 "브랜드와 사용자 사이의 주된 인터페이스가 에이전트(Agent)가 되는 시대"가 곧 도래할 것이라고 믿는다. 1990~2000년대의 웹사이트, 2010년대의 모바일 앱처럼, 앞으로는 모든 비즈니스가 사용자와 상호작용하는 자체 에이전트를 갖게 될 것이라는 비전이다.

  • CLEAR: Sierra 에이전트가 멤버십 관리와 문의 응대를 수행
  • ADT: 알람 트러블슈팅과 결제 이슈 해결을 에이전트에 위임
  • Sonos: "time to music(첫 음악 재생까지 걸리는 시간)"이라는 핵심 온보딩 지표 단축에 AI 에이전트 활용

Sierra의 핵심 제품은 Agent OS다. 이 플랫폼은 코드 기반 개발(Agent SDK)과 노코드(Agent Studio)를 모두 지원한다.

  • Agent SDK: 개발자가 직접 고객 여정과 워크플로우를 정의할 수 있는 PaaS. 버전 관리, 릴리스 게이팅, CI/CD, 감사 등 표준 SDLC와 자연스럽게 통합된다.
  • Agent Studio: 비개발자 팀이 자연어(영어)로 고객 여정을 정의할 수 있는 노코드 도구. ClickHouse를 기반으로 에이전트 성능 측정, 실험, 제품-대화 데이터 연결이 이루어진다.
에이전트는 흥미로운 점이 있습니다. 모든 인터랙션이 사용자가 어디에서 막혔는지를 그대로 보여주거든요. 회사의 로드맵을 어떻게 가져갈지 결정할 때, 마찰이 어디서 발생하는지 정확히 알 수 있습니다. 우리는 그 데이터를 ClickHouse로 다룹니다.

옵저버빌리티와 분석은 왜 멀어졌는가

Sierra가 만드는 세계에서는 모든 사용자 인터랙션이 기술적·행동적·비즈니스적 신호로 가득 차 있다. 그러나 전통적으로 이 신호를 처리하는 도구는 두 갈래로 갈라져 있었다.

옵저버빌리티 스택

  • 속도와 시스템 상태에 최적화
  • SRE/DevOps가 레이턴시·에러·알람을 모니터링
  • 인프라 엔지니어가 배포·용량 계획 담당
  • 보안/컴플라이언스 팀이 감사·이상 탐지 수행
  • 밀리초 단위 쿼리, 0에 가까운 인제스션 지연 요구
  • 성능을 위해 고카디널리티 필드를 떨궈내고 차원을 제한

분석 스택

  • 장기 추세와 사용자 행동에 최적화
  • PM이 기능 채택·실험 결과 분석
  • 데이터 분석가가 세그멘테이션·어트리뷰션 리포트 작성
  • 임원진이 KPI·비즈니스 예측 추적
  • 복잡한 조인, 풍부한 컨텍스트, 장기 저장에 우선순위

Arup의 표현을 빌리면, "분리된 스택은 요구사항이 아니라 우회책(workaround)이었다." ClickHouse 같은 솔루션이 존재하기 전, 기술적 제약 때문에 어쩔 수 없이 선택한 결과였다는 것이다.

ClickHouse로 다리를 놓다

Sierra가 옵저버빌리티와 분석을 분리할 수 없었던 결정적 이유는 outcome-based pricing(결과 기반 과금) 모델 때문이다. 고객 반품 API의 HTTP 에러는 단순한 가동 시간 이슈가 아니다. 사용자가 문제를 해결했는지, 그리고 Sierra가 그 트랜잭션에 대해 과금할 수 있는지를 결정한다.

시스템이 다운되어 트랜잭션이 실패하면, 사람에게 에스컬레이션하고 그 트랜잭션에 대해서는 과금하지 않습니다. 시스템 메트릭이 곧 비즈니스 결과로 직결되는 거죠.

Sierra는 옵저버빌리티와 분석을 같은 이벤트 스트림에 대한 두 가지 시선으로 재정의했고, ClickHouse가 그 통합을 가능하게 했다.

ClickHouse가 가능하게 한 것들

  • 컬럼나 스토리지 + 벡터화 쿼리 실행: 대규모 데이터에서 초고속 쿼리
  • Materialized View: 분 단위 핵심 메트릭 집계를 사전 계산
  • 실시간 인제스션: Kafka, Kinesis, S3와의 통합으로 라이브 대시보드/알람 구현
  • 고카디널리티 데이터 보존: 필드를 떨궈내지 않고 전체 컨텍스트를 SQL로 조회
우리는 더 이상 카디널리티를 두려워하지 않습니다. 여전히 쿼리 성능을 위해 데이터를 모양 잡아야 하지만, Materialized View와 사전 집계 같은 기법으로 걱정할 필요가 없어졌어요. 모든 데이터를 한 곳에 두고, 모든 질문에 답할 수 있게 된 겁니다.

쿼리를 실시간 알람으로

ClickHouse는 Sierra의 대시보드와 분석뿐 아니라 실시간 알람까지 책임진다.

  1. 모든 사용자 인터랙션(음성/채팅)이 구조화된 이벤트로 ClickHouse에 기록된다.
  2. 이벤트는 중앙 테이블로 모이고, Materialized View가 분 단위로 핵심 메트릭을 집계한다.
  3. ClickHouse의 Web Query API가 Prometheus wire format을 지원하므로, Prometheus를 ClickHouse 엔드포인트에 붙여 매 분 스크랩한다.
  4. Prometheus가 알람 평가·스케줄링·전송을 처리해, 이상이 감지되면 고객에게 즉시 알린다.

현재는 알람이 수동으로 구성되지만, 궁극적인 목표는 셀프 서비스다.

고객이 분석 대시보드를 보다가 클릭 한 번으로 자신이 신경 쓰는 비즈니스 메트릭에 알람을 걸 수 있도록 만들고 싶습니다. 옵저버빌리티와 분석은 결국 같은 동전의 양면이니까요.

하나의 섬, 하나의 언어

Sierra의 변화는 인프라에 머무르지 않는다. 기술적으로는 ClickHouse를 통해 시스템을 통합하고, 문화적으로는 모든 팀에 공통의 언어와 현실 인식을 제공하고 있다.

모든 것은 결국 이벤트입니다. 시스템 에러와 장애, 사용자 행동, 제품 인사이트가 같은 스트림을 따라 흐르죠. ClickHouse를 엔진으로 두면, 그 데이터를 저장하고 SQL로 분석하고, 모든 계층의 성능을 연결할 수 있습니다.

Arup이 본 변화는 구체적이다.

  • PM이 시스템 메트릭으로 대화하기 시작했다.
  • 플랫폼 엔지니어가 인프라 변화가 비즈니스 성과에 미치는 영향을 고민한다.
  • 데이터가 함께 살고 있다는 사실 자체가 핵심이다.

결론

Sierra의 사례는 ClickHouse가 단순히 빠른 데이터베이스를 넘어, 조직 내 사일로를 허무는 도구가 될 수 있음을 보여준다. 옵저버빌리티와 분석을 같은 컴퓨트 엔진 위에서 통합하면, 인프라뿐 아니라 팀 간의 언어와 우선순위까지 정렬된다.

AI 에이전트처럼 모든 인터랙션이 곧 비즈니스 결과인 시대에는, "기술 데이터"와 "비즈니스 데이터"의 구분 자체가 시대착오일지 모른다. Sierra가 ClickHouse로 그 답을 증명하고 있다.