All-in-One 데이터 사이언스 플랫폼

Dataiku

Dataiku(다타이쿠)는 효율적인 빅데이터 프로젝트를 위한 협업 기반의 All-in-One 데이터 사이언스 플랫폼입니다.

데이터 전처리 및 분석(시각화), 통계와 머신러닝까지 빅데이터 분석 프로젝트의 모든 과정을 Dataiku의 Data Workflow 기반으로 다양한 사용자들이 원활하게 협업할 수 있게 되어, 이를 통해 프로젝트 생산성 향상 및 ROI 극대화를 이룰 수 있습니다.




특징 Features

  • 빅데이터 분석

    • 워크플로우를 통한 복잡한 데이터 흐름의 쉬운 이해
    • 다양한 데이터 처리 엔진 지원
  • 다양한 방법의 데이터 분석

    • 데이터 분석 전문가의 코드(Code) 기반 데이터 분석
    • Dataiku 내장 기능을 활용한 코드리스(Codeless) 데이터 분석
  • 간편한 방법의 머신러닝 모델 작성

    • 클릭 기반의 예측 및 분류 모델 생성
    • 자동화된 기본 전처리를 통한 신속한 머신러닝 모델 생성
  • 풀 스택 협업 플랫폼

    • 내부 커뮤니케이션 기능을 통해 원활한 프로젝트 수행 및 이력 관리
    • 위키 페이지를 통한 프로젝트 관련 문서의 체계적인 관리
    • 확장기능 개발 및 코드 재사용 환경 제공

기능 Functions

  • 다양한 데이터 소스와 연동 기능

    • Hadoop 포함 30개 이상의 빌트인 커넥터 지원
    • 커스텀 커넥터를 통한 맞춤형 데이터 저장소 연결 지원
  • 직관적인 데이터 이해

    • 간편한 데이터 분석 및 Drag&Drop 방식의 기본 차트 제공
    • 신속한 시각화를 통해 팀원과 공유
  • 사용자 스킬에 따른 다양한 데이터 전처리 기능

    • GUI 기반의 내장 기능(Join, Group, Sort, Pivot, etc.)을 활용하여 클릭만으로 분석
    • 대표적인 데이터 분석 언어(Python, R, Scala, etc.)를 통한 Code 기반 분석
    • Plug-in 제작을 통한 코드 재사용 기능 제공
  • 간편한 머신러닝(ML) 모델 생성 및 관리 기능

    • 클릭만으로 머신러닝 모델을 생성, 평가
    • 머신러닝 모델 개발을 위한 시각적인 단계별 프로세스
    • Grid Search 기반 최적 모델 선택 및 편리한 모델 업데이트

장점 Advantages

  • 신속한 파일럿 프로젝트 수행 및 검증

    • 간편한 데이터 분석을 통한 신속한 파일럿 프로젝트 수행 가능
    • 프로젝트 수행 효율성 증가로 데이터 사이언스 부문 ROI 향상
  • 시나리오를 통한 모델 및 보고서 생성 자동화

    • 트리거(시간 주기, 데이터 업데이트, 등) 기반의 자동화된 모델 업데이트
    • 자동화된 보고서 및 대시보드 생성을 통해 편리한 데이터 현황 파악
  • 간편한 모델 배포 및 관리

    • API Deployer를 통한 머신러닝 모델의 간편한 배포 및 관리
    • 확장 가능한(Scalable) API Node를 통한 머신러닝 모델 서비스 부하 분산
  • 기획, 개발, 운영 등 조직 간 유연한 협업

    • 부서 간 불필요한 소통 억제
    • 각 부서의 정확한 Role 할당 가능스

Dataiku Data Science Studio 활용 방안 예시

  • (Case 1) 단발성 데이터 사이언스 프로젝트에서의 활용

    • 다양한 기능을 활용한 신속한 프로젝트 수행
    • 개별적 코드 환경 관리 및 Jupyter notebook 지원으로 분석 편의성 제공
    • 대시보드 및 리포트 기능을 활용하여 프로젝트의 결과 정리 및 공유
  • (Case 2) 자동화 기능 기반으로 데이터 파이프라인 구축에서의 활용

    • 이기종 데이터 소스에서 데이터셋을 구성하는 데이터 파이프라인의 간편한 설계
    • 시나리오 기능을 활용하여 데이터셋 업데이트 및 보고서 생성 자동화
  • (Case 3) 모델 서비스 제공을 목표로 하는 데이터팀에서의 활용

    • 다양한 프로젝트의 신속한 수행으로 효율적인 데이터 분석 업무 수행
    • 간편한 모델 배포를 기반으로 모델 활용 부서에 신속한 서비스 제공
    • Plug-in, Sample Code 등의 기능으로 코드 재사용성 강화

주요 고객

제 품문 의
top