banner
뉴스 센터
포괄적인 경험과 고급 방법론

Photobox는 관찰 가능성에 대한 훨씬 더 명확한 그림을 개발합니다.

Aug 29, 2023

Photobox는 Dynatrace 관측 플랫폼을 사용하여 모든 시스템 모니터링 데이터를 단일 창으로 통합하고 있습니다. 현재 albelli-Photobox 그룹의 일부가 된 맞춤형 인쇄 회사는 2022년 말 합병 전에 플랫폼을 도입했습니다.

이전에는 회사에서 시스템 문제에 대해 사전 예방적인 접근 방식을 취하는 것이 어렵다는 것을 알았습니다. 회사의 IT 직원은 AWS EC2와 Kubernetes 및 AWS Lambda에서 실행되는 마이크로 서비스를 기반으로 구축된 복잡한 기술 스택을 모니터링해야 했습니다.

albelli-Photobox Group의 엔지니어링 이사인 Alex Hibbitt에 따르면:

일련의 인수합병을 통해 복잡한 스택이 만들어졌습니다. 그 수준의 복잡성은 효과적으로 관찰하기가 엄청나게 어려워집니다. 우리는 약 10가지 기술을 사용하는 최소 5가지 관찰 플랫폼을 보유하고 있었습니다. 관찰 가능성은 정말 노련한 소수의 엔지니어만이 소유할 수 있는 기술이 되었습니다.

Hibbitt는 IT 문제를 식별하는 데 최대 4시간이 걸릴 수 있다고 회상합니다. 한편, 관찰 가능성의 복잡한 특성으로 인해 수행하기 어려운 프로세스가 있었습니다. 그는 효과적인 관찰 가능성이 부족하여 확장성과 대응성 문제가 발생했다고 말했습니다.

문제에 대응하는 것이 정말 어려웠습니다. 무슨 일이 생기면 우리는 최고의 문제 해결사를 붙잡아 그들에게 에테르를 느끼게 하여 '아, 여기 어딘가에 있는 것 같아'라고 말하게 해야 합니다. 그 접근 방식은 그리 과학적이지 않았습니다.

복잡한 스택 내의 문제에 대응하는 능력과 엔지니어링 노력에 집중하고 있는 곳에 통찰력을 적용하는 능력 측면에서 우리의 판도가 바뀌었습니다.

회사는 다른 조치를 취할 필요가 있음을 인식했습니다. 첫 번째 시도로 기업은 자체 관찰 도구를 도입했습니다. 그러나 이 맞춤형 기술은 가치를 창출하기보다는 복잡성을 한 단계 더 추가했을 뿐입니다. 그 시점에서 Photobox는 문제에 대한 잠재적인 해결책에 대해 기술 공급업체와 대화하기 시작했습니다. 히빗은 이렇게 말합니다.

우리는 프런트엔드에서 백엔드 데이터베이스 서비스까지 모든 것을 포괄할 수 있는 하나의 도구, 즉 우리가 원했던 희망 목록을 모았습니다. 우리는 플랫폼에 대한 액세스를 민주화하여 모든 엔지니어가 프로세스를 선택하고 자신이 수행하는 작업을 이해할 수 있기를 원했습니다. 그리고 우리는 어떤 경고가 정말 중요한지 확인할 수 있도록 신호 대 잡음 비율에 도움이 되는 것이 필요했습니다.

잠재적인 솔루션을 식별하기 위해 위시 리스트를 사용한 후 Photobox는 몇몇 공급업체와 함께 낮은 수준의 시험을 완료했습니다. 그런 다음 Hibbitt 팀은 선호하는 솔루션인 Dynatrace를 사용하여 장기간 파일럿을 실행했습니다. Photobox에서 실행되는 시스템의 복잡성으로 인해 회사는 플랫폼을 테스트하고 2021년 말에 의미 있는 데이터를 생성하기 위해 6개월 간의 유료 평가판을 설정했습니다.

시험판의 결과로 우리는 모든 프로덕션 환경에서 라이브를 실행했습니다. 이러한 전환은 단순히 보다 장기적인 구현에 연결하는 것이었습니다. 핵심 테스트 포인트 중 하나는 '기존 플랫폼을 모두 끄고 Dynatrace에만 의존할 자신감이 있었습니까?'였습니다. 대답은 '예'였습니다. 이제 이는 우리 기술 스택의 핵심 부분이 되었습니다.

Hibbitt는 Dynatrace의 자동화 및 AIOps 기능을 도입하여 몇 가지 큰 이점을 얻었다고 말합니다. Photobox는 문제 해결에 소요되는 평균 시간을 80% 단축하고 쇼핑 피크 기간 동안 서비스 가용성에 영향을 미치는 심각한 사고 건수를 60% 줄였습니다. Dynatrace 접근 방식의 주요 이점 중 하나는 플랫폼의 문제 카드입니다.

카드는 사고에서 잘못되었을 수 있는 다양한 관련 측정항목을 모두 모아 전체적인 보기로 표시합니다. 정말 멋진 두 가지 일을 합니다. 첫째, 문제로 인해 영향을 받는 고객 수에 대한 아이디어를 제공하며, 이는 엔지니어가 실제로 중요한 사항인지 정량화하는 데 도움이 됩니다. 둘째, 잠재적인 문제를 식별하는 근본 원인 분석을 수행합니다. 그리고 우리와 같은 분산된 마이크로 서비스 기반 조직에서는 이는 매우 도움이 됩니다.