Splunk for ITOps : MDS테크

Splunk for ITOps

기업의 IT 팀은 비즈니스를 위한 IT 서비스 제공을 책임지기 때문에 조직 내 모든 머신 데이터에 대한 서비스 중심 뷰(view)와 함께 관련 성능 지표들에 대한 통찰력이 필요합니다. 비즈니스의 원활한 운영을 보장하려면 다양한 포맷의 데이터 소스 처리, 제대로 통합되지 않은 디바이스의 확정성, 오랜 구축 기간 등 기존 제품들이 갖고 있는 어려움을 극복해야 합니다. 이를 위해 IT 팀에 운영 상태 및 성능 지표들에 대한 즉각적인 가시성을 제공하는 솔루션이 필요합니다.

Splunk IT Service Intelligence(ITSI)는 IT 서비스의 운영관리를 위해 구축된 Splunk 환경에서 실행되는 프리미엄 솔루션입니다. 머신러닝으로 강화된 인공지능을 활용하여 데이터 중심의 새로운 모니터링 및 분석 방식을 통해 IT 서비스를 위한 통찰력을 제공합니다. 그리고 변화가 많은 IT 서비스를 연결하며 중앙화된 뷰(view)를 통해 더욱 손쉬운 IT 운영 관리가 가능합니다.

  • 예측 및 예방

    • 서비스 품질 저하를 사전 예측
    • 사고가 영향을 미치기 전에 신속한 조치 수행을 지원
  • 어느 곳에서든 데이터를 액션으로 전환

    • 조직 전반에 대한 통찰력을 얻기 위해 대량의 정형 및 비정형 데이터를 분석
    • 직접 설치(On-premise) 및 클라우드 환경 모두 지원
  • 확장 가능한 AIOps(인공지능을 위한 IT운영) 플랫폼

    • AIOps 기반의 통찰력을 활용하여 문제 감지, 조사 간소화, 문제 분석 및 최종 사용자 환경 개선

기능 Functions

  • Glass Tables

    • Glass Table을 통해 성능에 대한 높은 수준의 통찰력과 인프라에 대한 더 많은 기술적 뷰(view)를 제공
    • 현재 문제를 조사하고 해결하는 데 사용할 수 있으며, 향후 문제가 발생하지 않도록 예측 및 예방 가능
  • 예측 분석

    • ITSI는 애플리케이션, 서비스 및 인프라 전반에서 강력한 모니터링과 문제 해결의 기능을 갖추고 있으며, 예측 능력도 제공함
    • ITSI는 과거 KPI(Key Performance Indicator, 핵심성과지표) 데이터를 활용하고 조직 전체의 다른 데이터와 상호 연관시켜 예측을 하고, 예측이 어떤 KPI에 근거하는지 보여주며 문제 해결 시간을 단축함
  • 적응형 임계값 설정

    • 적응형 임계값은 표준 메트릭 및 KPI에 적용 가능
    • 적응형 임계값은 머신러닝 기법을 사용하여 과거 데이터를 분석하여 허위 경고를 방지하기 위해 주기적으로 자동적으로 재계산됨
  • 통합 화면 및 “Data-to-Everything”

    • 서비스 운영의 문제 발생 시 정확한 원인을 찾기 위해 적절한 담당자를 지정하여 문제를 해결하도록 지원
  • 서비스 분석기

    • 서비스 분석기는 서비스 및 KPI 상태에 대한 또 다른 고급 보기를 제공함
    • 문제가 발생한 서비스 및 KPI는 화면 상단에 이동되어 표시되므로 클릭해서 신속하게 조사할 수 있음
  • 딥 다이브(Deep Dive)

    • 딥 다이브 기능을 통해 문제의 원인을 파악하고, 특정 시간대의 여러 KPI, 지표, 이벤트들을 비교할 수 있음
    • Ad hoc 검색 또는 KPI 데이터를 사용하여 단 몇 번의 클릭으로 딥 다이브에 새로운 레인(lane)을 추가할 수 있음
    • 모든 정보를 한 곳에서 관리함으로써 트렌드에 대한 핵심적인 통찰력을 확보하도록 지원
  • 이벤트 분석기

    • 다수의 솔루션과 장비에서 발생하는 다수의 경고를 수신하여도 연관된 이벤트를 그룹화하여 노이즈를 95% 이상 줄일 수 있으며, MTTK(Mean Time To Know) 및 MTTR(Mean Time To Resolution)의 속도를 높임
    • 제공되는 운영 정보를 통해 서비스의 우선 순위를 지정하고 확인 가능
    • 각 상황에 맞춰 적절한 조치를 선택하도록 지원(특정한 이벤트 그룹을 Phantom 또는 VictorOps로 이관 가능)
  • 멀티 KPI 경고

    • 서비스 전반의 KPI 상태를 연관 분석하는 새로운 그래픽 인터페이스를 사용하여 알림 또는 Notable Events를 생성
    • 즉각적인 조치가 필요한 문제들을 신속하게 파악하고, 문제가 발생하기 전에 잠재적인 문제들을 사전에 감지 가능

장점 Adventages

  • 강력한 시각화 기능을 통해 서비스 상태 및 주요 성능 지표에 대한 포괄적이고 심도 깊은 실시간 가시성 제공

  • 생성되어 있는 상호연관 검색을 활용하거나 자체 검색을 실행하여 문제 발생을 조기에 탐지

  • 예외적이거나 비정상적인 징후들을 찾아내고, 비즈니스에 중요한 서비스 레벨에 영향을 미치는 근본원인을 신속하게 파악

  • 수동 및 능동 KPI 임계치를 사용하여 주요 지표 추적

  • 실체(entities)와 유용한 메타데이터를 통해 서비스의 개별 구성요소 모니터링 가능

기대효과 Benefits
  • 문제 발생 조기 예측
  • 높은 우선순위 사고의 발생 감소: 10-15%
  • 문제 조사 소요 시간 단축: 70-90%
  • 고객이 개발하는 서비스 제품의 시장 출시 기간 단축: 15-45%
  • 무의미한 이벤트의 수량 감소: 95%
제 품문 의
top