DORA 메트릭은 엔지니어링 성과를 측정하지만, 대부분의 팀은 아키텍처와 분리하여 추적합니다. 이 가이드는 DORA 메트릭을 아키텍처 결정에 연결하고, 시스템 설계를 안내하는 데 활용하며, Archyl의 DORA 통합으로 아키텍처 인식 성과 추적을 수행하는 방법을 설명합니다.

소프트웨어 아키텍처 팀을 위한 DORA 메트릭

엔지니어링 팀은 수년간 DORA 메트릭을 추적해왔습니다. Deployment Frequency, Lead Time for Changes, Change Failure Rate, Mean Time to Restore는 소프트웨어 딜리버리 성과의 표준 벤치마크가 되었습니다. 연구는 명확합니다: 이 네 가지 메트릭에서 우수한 성과를 보이는 팀은 더 나은 소프트웨어를 더 빠르게 제공합니다.

하지만 대부분의 팀이 DORA 메트릭을 사용하는 방식에는 공백이 있습니다. 팀이나 조직 수준에서 숫자를 추적하고, 개선되면 축하하고, 하락하면 조사합니다 -- 그게 전부입니다. 메트릭이 이를 추동하는 아키텍처 결정과 분리되어 존재합니다.

이것은 놓친 기회입니다. 아키텍처는 팀이 DORA 메트릭을 개선하기 위해 가진 가장 큰 레버입니다. 서비스를 분해하는 방식, 통신 패턴을 설계하는 방식, 배포 파이프라인을 구조화하는 방식, 의존성을 관리하는 방식이 얼마나 빨리 배포하고, 얼마나 자주 장애가 발생하고, 얼마나 빨리 복구하는지를 직접 결정합니다.

이 가이드는 DORA 메트릭을 아키텍처에 연결합니다. 각 메트릭이 아키텍처 팀에 구체적으로 무엇을 의미하는지, 아키텍처 결정이 수치에 어떻게 영향을 미치는지, Archyl의 DORA 통합을 사용하여 시스템 설계의 맥락에서 성과를 추적하는 방법을 다룹니다.

DORA 메트릭 간략 복습

DORA 연구 프로그램(DevOps Research and Assessment, 현재 Google Cloud의 일부)은 소프트웨어 딜리버리 성과를 예측하는 네 가지 메트릭을 식별했습니다:

Deployment Frequency는 팀이 프로덕션에 얼마나 자주 배포하는지 측정합니다. 엘리트 팀은 온디맨드로 하루에 여러 번 배포합니다. 저성과 팀은 월 1회 미만 배포합니다.

Lead Time for Changes는 코드 커밋에서 프로덕션 배포까지의 시간을 측정합니다. 엘리트 팀은 하루 이내입니다. 저성과 팀은 1개월에서 6개월이 걸립니다.

Change Failure Rate는 수정(핫픽스, 롤백, 패치)이 필요한 프로덕션 장애를 유발하는 배포의 비율을 측정합니다. 엘리트 팀은 0-5%입니다. 저성과 팀은 46%를 초과합니다.

**Mean Time to Restore (MTTR)**는 프로덕션 장애에서 복구하는 데 걸리는 시간을 측정합니다. 엘리트 팀은 1시간 이내에 서비스를 복구합니다. 저성과 팀은 1주에서 1개월이 걸립니다.

이 네 가지 메트릭이 함께 균형 잡힌 시각을 만듭니다: 하나를 다른 것의 비용으로 최적화하여 게임할 수 없습니다. 더 자주 배포하는 것은 장애율이 낮게 유지될 때만 도움이 됩니다. 낮은 장애율은 실제로 충분히 자주 배포하여 가치를 제공할 때만 의미가 있습니다.

아키텍처 결정이 DORA 메트릭을 추동하는 방식

모든 DORA 메트릭은 아키텍처의 영향을 받습니다. 이러한 연결을 이해하면 딜리버리 성과를 방해하지 않고 개선하는 아키텍처 선택을 할 수 있습니다.

Deployment Frequency와 서비스 분해

Deployment Frequency는 근본적으로 아키텍처 문제입니다. 시스템이 모놀리스이면, 모든 배포가 전체 시스템 배포입니다. 모든 팀의 변경이 함께 나갑니다. 한 팀의 미완성 기능이 다른 팀의 중요한 버그 수정을 막습니다. 배포 빈도가 가장 느린 팀에 의해 제약됩니다.

마이크로서비스는 서비스를 독립적으로 배포 가능하게 만들어 이를 해결합니다. 결제 팀은 하루 세 번 배포할 수 있고 검색 팀은 주간 배포를 할 수 있습니다. 각 서비스는 자체 배포 파이프라인, 자체 릴리스 주기, 자체 리스크 프로파일을 가집니다.

하지만 아키텍처가 이 독립성을 진정으로 지원해야 합니다. "마이크로서비스"가 데이터베이스를 공유하거나, 서비스 A를 배포하면 서비스 B를 재배포해야 한다면, 분산 모놀리스입니다 -- 마이크로서비스의 모든 복잡성에 배포 독립성의 이점은 없는.

아키텍처 팀은 조직 전체 평균이 아닌 서비스별 Deployment Frequency를 추적해야 합니다. 일부 서비스가 하루 10번 배포하는데 다른 서비스는 월 1회 배포한다면, 그 격차는 조사할 가치가 있는 아키텍처 결합을 신호합니다.

Lead Time과 파이프라인 아키텍처

Lead Time for Changes는 두 가지에 의존합니다: 코드가 대기하는 시간(리뷰, 테스트 스위트, 배포 윈도우)과 배포 파이프라인 실행 시간.

아키텍처가 둘 다에 영향을 미칩니다. 명확한 서비스 경계로 잘 분해된 시스템은 더 작고 집중된 변경을 가능하게 합니다. 작은 변경은 리뷰가 빠르고, 테스트가 빠르며, 배포 리스크가 낮습니다. 모놀리스는 더 많은 코드를 건드리는 더 큰 변경을 강제하여, 더 많은 리뷰 시간, 더 광범위한 테스트가 필요합니다.

CI/CD 파이프라인 자체의 아키텍처도 중요합니다. 테스트 스위트가 30개 서비스에 걸쳐 엔드투엔드 테스트를 실행하느라 45분이 걸리면, 리드 타임에 45분의 하한선이 있습니다. 아키텍처 팀은 파이프라인을 일급 시스템으로 취급하고 애플리케이션 아키텍처를 최적화하는 것과 같은 방식으로 구조를 최적화해야 합니다.

Change Failure Rate와 결합

Change Failure Rate는 아키텍처 건강의 가장 직접적인 지표입니다. 높은 장애율은 거의 항상 아키텍처 문제로 귀결됩니다:

서비스 간 강한 결합으로 한 서비스의 변경이 다른 서비스를 깨뜨림
공유 데이터베이스가 서비스 아키텍처에서 보이지 않는 암묵적 의존성을 만듦
API 계약 부재로 호환되지 않는 변경이 감지 없이 통과됨
부적절한 서비스 경계로 변경이 예기치 않은 부수 효과를 가짐

Change Failure Rate가 높으면, 가장 먼저 볼 곳이 아키텍처입니다. 서비스가 정말로 독립적인가? 계약이 시행되고 있는가? 의존성이 명시적이고 잘 관리되고 있는가?

아키텍처 문서가 여기서 직접적인 역할을 합니다. 개발자가 변경 전에 의존성 그래프를 볼 수 있으면, 호환되지 않는 변경을 도입할 가능성이 줄어듭니다. API 계약이 문서화되고 시행되면, 호환되지 않는 변경이 배포 전에 잡힙니다.

MTTR과 관측성 아키텍처

Mean Time to Restore는 무엇이 잘못되었는지 얼마나 빨리 식별하고 수정(또는 롤백)을 배포할 수 있는지에 의존합니다. 아키텍처가 둘 다에 영향을 미칩니다:

서비스 격리가 장애의 폭발 반경을 제한합니다. 추천 서비스가 다운되어도 핵심 쇼핑 플로우는 여전히 작동해야 합니다.
Circuit breaker와 fallback이 서비스 경계를 넘는 연쇄 장애를 방지합니다.
독립적 배포 가능성으로 다른 서비스에 영향을 주지 않고 단일 서비스를 롤백할 수 있습니다.
관측성 아키텍처 (분산 추적, 중앙 집중식 로깅, 메트릭)가 근본 원인을 얼마나 빨리 찾을 수 있는지 결정합니다.

좋은 아키텍처 문서가 있는 팀은 더 빨리 복구합니다. 어떤 서비스가 장애의 원인인지 빠르게 식별하고, 의존성을 이해하고, 롤백의 영향을 평가할 수 있기 때문입니다.

DORA 메트릭으로 아키텍처 결정 안내하기

DORA 메트릭은 보고만을 위한 것이 아닙니다 -- 아키텍처 팀을 위한 의사결정 도구입니다.

아키텍처 병목 식별

특정 서비스의 Deployment Frequency가 낮으면, 해당 서비스 주변의 아키텍처를 조사합니다. 일반적인 원인:

서비스가 너무 크고 변경이 자주 배포하기에 너무 위험
서비스에 조율된 배포가 필요한 암묵적 의존성이 있음
서비스가 다른 서비스와 강하게 결합되어 테스트 스위트가 너무 느림
배포 파이프라인에 수동 단계나 승인이 필요

이러한 원인 각각에 아키텍처적 솔루션이 있습니다. 서비스 분해, 의존성 분리, 테스트 스위트 격리, 배포 자동화는 모두 아키텍처 변경입니다.

분해 결정 검증

모놀리스를 마이크로서비스로 분할한 후, DORA 메트릭이 분해가 효과적인지 알려줍니다. Deployment Frequency가 증가하고 Change Failure Rate가 유지되거나 감소했으면 분해가 성공적입니다. Change Failure Rate가 증가했으면, 서비스 경계가 잘못되었을 수 있습니다 -- 잘못된 축을 기준으로 분할하거나 너무 많은 서비스 간 의존성을 만들고 있을 수 있습니다.

아키텍처 마이그레이션의 영향 측정

REST에서 gRPC로 마이그레이션하거나, event-driven 아키텍처를 도입하거나, 서비스 메시를 도입할 때, DORA 메트릭이 영향을 정량화합니다. 마이그레이션 전후에 메트릭을 추적하여 아키텍처 변경이 딜리버리 성과를 개선했는지 검증합니다.

이는 특히 리더십에 아키텍처 투자를 정당화하는 데 가치가 있습니다. "주문과 재고 서비스 사이에 event-driven 통신을 도입하는 데 3개월을 투자했다"는 평가하기 어렵습니다. "Event-driven 통신 도입 후 Deployment Frequency가 40% 증가하고 Change Failure Rate가 25% 감소했다"는 구체적인 성과입니다.

아키텍처 인식 목표 설정

조직 전체 DORA 목표를 설정하는 대신, 서비스별 또는 도메인별 목표를 설정합니다. 중요한 결제 서비스는 0% Change Failure Rate와 주간 배포를 목표로 할 수 있고, 내부 분석 대시보드는 5% 장애율과 일간 배포를 수용할 수 있습니다.

이러한 차별화된 목표는 모든 서비스가 같은 리스크 프로파일을 갖지 않으며, 아키텍처 결정이 이를 반영해야 함을 인정합니다. 결제 서비스는 내부 도구보다 더 엄격한 테스트 및 배포 관행을 요구합니다.

Archyl에서의 DORA 메트릭

Archyl은 릴리스 데이터에서 자동으로 DORA 메트릭을 계산하며 -- 핵심적으로 -- 이를 아키텍처 모델에 연결합니다. 메트릭과 아키텍처 사이의 이 연결이 Archyl의 DORA 구현을 독립형 메트릭 대시보드와 차별화합니다.

릴리스 데이터에서 자동 계산

Archyl에서 릴리스를 추적하고 있다면(GitHub Actions, 웹훅, REST API를 통해), DORA 메트릭이 자동으로 계산됩니다. 모든 릴리스에는 타임스탬프, 상태, 환경이 있습니다. 네 가지 메트릭을 모두 계산하기에 충분한 데이터입니다:

Deployment Frequency: 성공적인 프로덕션 배포 횟수
Lead Time: 릴리스 생성과 성공적 배포 사이의 시간
Change Failure Rate: 실패/롤백된 배포와 총 배포의 비율
MTTR: 실패한 배포와 다음 성공적 배포 사이의 시간

설정이 필요 없습니다. 릴리스가 들어오면 메트릭이 계산됩니다.

성과 분류

각 메트릭은 DORA 연구 벤치마크를 기반으로 Elite, High, Medium, Low 성과로 분류됩니다. 스코어카드가 팀이 업계 벤치마크 대비 어디에 있는지 한눈에 보여줍니다.

추세 추적

Archyl은 시간에 따라 DORA 메트릭을 추적하여, 성과가 개선되고 있는지 저하되고 있는지 볼 수 있습니다. 이는 아키텍처 변경의 영향을 평가하는 데 필수적입니다. 대규모 리팩토링 후, 이후 몇 주와 몇 달에 걸쳐 메트릭 추세를 볼 수 있습니다.

아키텍처 맥락 메트릭

DORA 메트릭이 C4 모델과 함께 Archyl 내에 있으므로, 아키텍처 맥락에서 분석할 수 있습니다:

어떤 서비스가 가장 낮은 Deployment Frequency를 가지는가? 의존성 그래프와 교차 참조하여 결합 문제를 찾습니다.
어떤 서비스가 가장 높은 Change Failure Rate를 가지는가? 문서화된 API 계약과 적합성 규칙이 있는지 확인합니다.
MTTR이 서비스 소유권과 어떻게 상관되는가? 명확한 소유자가 없는 서비스는 복구 시간이 더 긴 경향이 있습니다.

이 아키텍처 맥락은 DORA 메트릭을 추상적 숫자에서 시스템 설계에 대한 실행 가능한 인사이트로 변환합니다.

다른 Archyl 기능과의 통합

DORA 메트릭은 다른 Archyl 기능에 연결됩니다:

릴리스가 메트릭 계산을 위한 원시 데이터를 제공
환경이 배포 필터링을 위한 프로덕션/스테이징/개발 맥락 제공
소유권 맵이 메트릭을 책임 팀에 연결
적합성 규칙이 메트릭이 임계값 아래로 떨어지면 알림을 트리거할 수 있음
웹훅이 DORA 성과 수준이 변경되면 외부 시스템에 알릴 수 있음

DORA 기반 아키텍처 실천 구축

DORA 메트릭을 아키텍처 팀 워크플로에 통합하는 실용적 접근 방식입니다.

1단계: 현재 성과 기준선 설정

변경하기 전에 현재 DORA 메트릭을 측정합니다. Archyl에서 릴리스 추적을 설정하고 최소 30일간 메트릭을 계산하여 기준선을 확립합니다. 개선하려 하기 전에 현재 위치를 이해합니다.

2단계: 메트릭과 아키텍처 상관관계 분석

아키텍처 맥락에서 기준선 메트릭을 분석합니다:

Deployment Frequency 차이가 서비스 크기나 결합과 상관관계가 있는가?
높은 Change Failure Rate를 가진 서비스가 약한 문서나 적은 적합성 규칙을 가지고 있는가?
여러 팀이 소유한 서비스 vs. 단일 소유 서비스에서 MTTR이 더 긴가?

이러한 상관관계가 성과 개선 가능성이 가장 높은 아키텍처 변경을 지목합니다.

3단계: 아키텍처 개선 우선순위 지정

상관관계 분석을 사용하여 아키텍처 작업의 우선순위를 정합니다:

결합이 병목이면, 서비스 분리와 event-driven 통신 도입에 투자
계약 부재가 장애를 유발하면, API 계약 문서화와 시행에 투자
소유권 공백이 복구를 지연시키면, 명확한 소유권 매핑과 온콜 프로세스에 투자

4단계: 영향 측정

아키텍처 변경 후, DORA 메트릭을 추적하여 영향을 검증합니다. 결론을 내리기 전에 변경이 안정화될 수 있도록 최소 4-6주를 줍니다. 아키텍처 개선은 종종 메트릭에 나타나기까지 시간이 걸립니다.

5단계: 반복적 관행으로 만들기

아키텍처와 함께 분기별로 DORA 메트릭을 검토합니다. 메트릭을 사용하여 심각해지기 전에 나타나는 문제를 식별합니다. 개선을 축하합니다. 저하를 조사합니다. 데이터 기반 아키텍처 결정을 가끔 하는 연습이 아닌 습관으로 만듭니다.

흔한 오해

"DORA 메트릭은 DevOps 팀만의 것이다"

DORA 메트릭은 운영 관행과 아키텍처 결정 모두에 영향받는 딜리버리 성과를 측정합니다. 아키텍처 팀이 DevOps 팀과 함께 이 메트릭을 소유해야 합니다.

"DORA를 추적하려면 특수 도구가 필요하다"

타임스탬프와 상태가 있는 릴리스를 추적하고 있으면, 원시 데이터를 가지고 있는 것입니다. Archyl이 이 데이터에서 자동으로 메트릭을 계산합니다. 별도의 DORA 메트릭 플랫폼이 필요 없습니다.

"네 가지 메트릭을 동시에 최적화해야 한다"

아키텍처 문제에 의해 가장 제약받는 메트릭에 집중합니다. Deployment Frequency가 결합에 의해 제한된다면, 먼저 결합을 수정합니다. 다른 메트릭은 더 나은 아키텍처의 부수 효과로 개선될 가능성이 높습니다.

"DORA 메트릭은 모든 서비스에 동일하게 적용된다"

다른 서비스는 다른 리스크 프로파일과 다른 성과 기대치를 가집니다. 각 서비스의 중요도와 복잡성을 반영하는 아키텍처 인식 목표를 설정합니다.

결론

DORA 메트릭과 소프트웨어 아키텍처는 깊이 연결되어 있습니다. 아키텍처 결정이 Deployment Frequency, Lead Time, Change Failure Rate, 복구 시간을 추동합니다. DORA 메트릭을 사용하여 아키텍처 결정을 평가하고 안내하면, 딜리버리 성과와 시스템 설계 모두를 지속적으로 개선하는 피드백 루프가 만들어집니다.

Archyl은 릴리스 데이터에서 직접 DORA 메트릭을 계산하고 C4 모델과 함께 제시하여 메트릭과 아키텍처 사이의 격차를 메웁니다. 이 아키텍처 맥락이 추상적 숫자를 시스템에 대한 실행 가능한 인사이트로 변환합니다.

Archyl에서 DORA 메트릭 추적 시작하여 딜리버리 성과를 이를 추동하는 아키텍처 결정에 연결하세요.

소프트웨어 아키텍처 팀을 위한 DORA 메트릭 - Archyl Blog