Splunk IT Service Intelligence(ITSI) : MDS테크

데이터 기반 분석으로 서비스 모니터링 간소화

Splunk IT Service Intelligence(ITSI)

기업의 IT 팀은 비즈니스를 위한 IT 서비스 제공을 책임지기 때문에 조직 내 모든 머신 데이터에 대한 서비스 중심 뷰(view)와 함께 관련 성능 지표들에 대한 통찰력이 필요합니다. 비즈니스의 원활한 운영을 보장하려면 다양한 포맷의 데이터 소스 처리, 제대로 통합되지 않은 디바이스의 확정성, 오랜 구축 기간 등 기존 제품들이 갖고 있는 어려움을 극복해야 합니다. 이를 위해 IT 팀에 운영 상태 및 성능 지표들에 대한 즉각적인 가시성을 제공하는 솔루션이 필요합니다.

Splunk IT Service Intelligence(ITSI)는 IT 서비스의 운영관리를 위해 구축된 Splunk 환경에서 실행되는 프리미엄 솔루션입니다. 머신러닝으로 강화된 인공지능을 활용하여 데이터 중심의 새로운 모니터링 및 분석 방식을 통해 IT 서비스를 위한 통찰력을 제공합니다. 그리고 변화가 많은 IT 서비스를 연결하며 중앙화된 뷰(view)를 통해 더욱 손쉬운 IT 운영 관리가 가능합니다

특징 Features

예측 및 예방

- 서비스 품질 저하를 사전 예측- 사고가 영향을 미치기 전에 신속한 조치 수행을 지원

어느 곳에서든 데이터를 액션으로 전환

- 조직 전반에 대한 통찰력을 얻기 위해 대량의 정형 및 비정형 데이터를 분석- 직접 설치(On-premise) 및 클라우드 환경 모두 지원

확장 가능한 AIOps(인공지능을 위한 IT운영) 플랫폼

- 직원들이 각자 현재 위치에서 협업 가능- AIOps 기반의 통찰력을 활용하여 문제 감지, 조사 간소화, 문제 분석 및 최종 사용자 환경 개선

기능 Functions

Glass Tables

- Glass Table을 통해 성능에 대한 높은 수준의 통찰력과 인프라에 대한 더 많은 기술적 뷰(view)를 제공- 현재 문제를 조사하고 해결하는 데 사용할 수 있으며, 향후 문제가 발생하지 않도록 예측 및 예방 가능

예측 분석

- ITSI는 애플리케이션, 서비스 및 인프라 전반에서 강력한 모니터링과 문제 해결의 기능을 갖추고 있으며, 예측 능력도 제공함- ITSI는 과거 KPI(Key Performance Indicator, 핵심성과지표) 데이터를 활용하고 조직 전체의 다른 데이터와 상호 연관시켜 예측을 하고, 예측이 어떤 KPI에 근거하는지 보여주며 문제 해결 시간을 단축함

적응형 임계값 설정

- 적응형 임계값은 표준 메트릭 및 KPI에 적용 가능- 적응형 임계값은 머신러닝 기법을 사용하여 과거 데이터를 분석하여 허위 경고를 방지하기 위해 주기적으로 자동적으로 재계산됨

통합 화면 및 “Data-to-Everything”

- 서비스 운영의 문제 발생 시 정확한 원인을 찾기 위해 적절한 담당자를 지정하여 문제를 해결하도록 지원

서비스 분석기

- 서비스 분석기는 서비스 및 KPI 상태에 대한 또 다른 고급 보기를 제공함-  문제가 발생한 서비스 및 KPI는 화면 상단에 이동되어 표시되므로 클릭해서 신속하게 조사할 수 있음

딥 다이브(Deep Dive)

- 딥 다이브 기능을 통해 문제의 원인을 파악하고, 특정 시간대의 여러 KPI, 지표, 이벤트들을 비교할 수 있음- Ad hoc 검색 또는 KPI 데이터를 사용하여 단 몇 번의 클릭으로 딥 다이브에 새로운 레인(lane)을 추가할 수 있음- 모든 정보를 한 곳에서 관리함으로써 트렌드에 대한 핵심적인 통찰력을 확보하도록 지원

이벤트 분석기

- 다수의 솔루션과 장비에서 발생하는 다수의 경고를 수신하여도 연관된 이벤트를 그룹화하여 노이즈를 95% 이상 줄일 수 있으며, MTTK(Mean Time To Know) 및 MTTR(Mean Time To Resolution)의 속도를 높임- 제공되는 운영 정보를 통해 서비스의 우선 순위를 지정하고 확인 가능- 각 상황에 맞춰 적절한 조치를 선택하도록 지원(특정한 이벤트 그룹을 Phantom 또는 VictorOps로 이관 가능)

멀티 KPI 경고

- 서비스 전반의 KPI 상태를 연관 분석하는 새로운 그래픽 인터페이스를 사용하여 알림 또는 Notable Events를 생성- 즉각적인 조치가 필요한 문제들을 신속하게 파악하고, 문제가 발생하기 전에 잠재적인 문제들을 사전에 감지 가능

장점 Advantages

강력한 시각화 기능을 통해 서비스 상태 및 주요 성능 지표에 대한 포괄적이고 심도 깊은 실시간 가시성 제공

생성되어 있는 상호연관 검색을 활용하거나 자체 검색을 실행하여 문제 발생을 조기에 탐지

예외적이거나 비정상적인 징후들을 찾아내고, 비즈니스에 중요한 서비스 레벨에 영향을 미치는 근본원인을 신속하게 파악

수동 및 능동 KPI 임계치를 사용하여 주요 지표 추적

실체(entities)와 유용한 메타데이터를 통해 서비스의 개별 구성요소 모니터링 가능

기대효과 Benefits

문제 발생 조기 예측

문제 조사 소요 시간 단축: 70-90%

무의미한 이벤트의 수량 감소: 95%

높은 우선순위 사고의 발생 감소: 10-15%

고객이 개발하는 서비스 제품의 시장 출시 기간 단축: 15-45%

제 품문 의
top