빅데이터/머신러닝 솔루션

DataRobot

머신러닝 자동화 플랫폼 DataRobot은 세계 정상급 데이터 과학자들의 지식, 경험 및 모범사례를 적용하여 머신러닝 모델링을 자동화하고사용자 편의성을 제공합니다.
비즈니스 관계자, 분석가 및 데이터 과학자들의 기술 수준과 관계 없이 모든 사용자가 DataRobot을 통해 정확한 예측 모델을 수립하고 배포하는 시간을 획기적으로 단축할 수 있습니다.

DataRobot 사용의 장점

AI를 도입하기 위해서는 데이터과학자들의 확보 뿐 아니라 상당한 학습기간이 필요하기 때문에 도입을 결정하기까지 어려움이 있었지만,
DataRobot을 사용하면 일반인들도 자신이 보유한 현업지식을 적용해서 쉽게 머신러닝을 할 수 있습니다.

현업전문가가 사용할때

AI/머신러닝 기술에 쉽게 접근가능 합니다.

- 머신러닝 기술에 대해서 잘 모르고 있더라도, Datarobot을 사용하면 최상급 데이터과학자들의 경험이 반영된 모델을 작성할 수 있습니다. 숙련된 데이터과학자일 필요도 없고, 코딩도 필요 없습니다. DataRobot을 통해서 비즈니스 영역에 대한 새로운 인사이트를 찾을 수 있습니다.

데이터과학자가 사용할때

모델을 빌드하고, 최적화하고, 배포하는 과정이 극단적으로 쉽고 빨라집니다.

- 모델 빌드 및 배포과정에서 수백가지의 최신 머신러닝 알고리즘을 편리하게 적용해 볼 수 있고, Kaggle 상위 랭크된 데이터과학자들의 경험이 적용된 데이터 전처리, Feature Engineering, 모델링 병렬빌드가 자동화되어 실행됩니다.

소프트웨어개발자가 사용할때

AI/머신러닝을 적용해서 애플리케이션을 다른 수준의 제품으로 만들 수 있습니다.

- 머신러닝이 적용된 애플리케이션을 개발하는 과정에서, 최적의 모델개발을 위한 시간적/경험적 제한을 받게되는데, 데이터로봇을 사용하면 쉽고 빠르게 모델을 빌드하고, 모델들의 비교가 가능해서 머신러닝이 적용된 애플리케이션의 품질을 높이고, 배포시간을 단축시킬 수 있습니다.

DataRobot 작동방식

특징

머신러닝(ML) 모델링 자동화

- 머신러닝 모델링을 위한 10단계 과정을 자동화하여 현존하는 가장 높은 수준의 자동화를 제공하고, 이를 통해서 모델 개발을 매우 빠르게 진행할 수 있습니다.

획기적으로 빠른 머신러닝(ML) 모델 개발

- 모델링 과정을 자동화함으로써 개발 시간을 획기적으로 단축할 수 있습니다.- 모델 개발 과정 중 데이터 사이언티스트가 담당해야 했던 많은 부분을 자동화함으로써, 담당자는 좀 더 생산적이고 창의적인 데이터 분석에 집중할 수 있습니다.

 

 

높은 수준의 사용자 편의성

- 높은 수준으로 자동화함으로써 데이터 사이언티스트가 수행했던 머신러닝(ML) 모델 개발을 일반인도 쉽게 접근할 수 있습니다.- 머신러닝(ML) 알고리즘에 대한 깊이 있는 이해가 없어도 모델을 작성하는데 문제가 없습니다. 데이터 로딩에서 모델링 및 배포 과정이 마우스 클릭 몇 번으로 진행 가능할 정도로 사용하기 쉽습니다.

병렬처리 지원과 확장성

- 자동화 프로세스에 관여하는 Worker(Node)의 수를 상황에 따라 조정 가능합니다.- 더 많은 Worker를 사용해서 모델링 속도를 높일 수 있고, 병렬 처리를 지원하므로 동시에 많은 모델을 작성할 수도 있습니다.

모델의 투명성

- 모델링 과정이 모두 공개되어 있어서 데이터 전처리부터 알고리즘에 적용하는 방식 및 세팅현황까지 모두 확인할 수 있습니다.- 세계 최고 수준의 데이터 사이언티스트들이 뛰어난 성능의 알고리즘을 선별하고, 선별된 알고리즘을 Blueprint 형태로 최적화 및 프로세스화하여 제공합니다. 데이터를 알고리즘에 적용하여 모델을 훈련시키는 모델링 과정이 Blueprint를 통해 투명하게 공개됩니다.

높은 예측 정확도

- 다양한 알고리즘이 세계적인 데이터 과학자에 의해서 Blueprint형태로 최적화되어 있습니다.- 해결하고자 하는 문제에 적용 가능한 모든 알고리즘들에 적용하여 모델을 만들어 보고, 그중 어떤 알고리즘이 해당 데이터에 가장 적합한지 실증을 통해 비교하여 알 수 있기 때문에 높은 정확도를 기대할 수 있습니다.

손쉬운 배포

- Batch, Simple API, Code scoring, Application, Hadoop 등과 같이 다양한 방식으로 배포가 가능합니다.- 다양한 배포 옵션을 이용해서 모델링 후 바로 적용할 수 있습니다. 모델을 적용하기위한 별도의 응용 프로그램을 개발해야 했던 기존의 방식과 달리, DataRobot은 다양한 옵션을 사용하여 배포하거나, 혹은 플랫폼상에 응용프로그램을 생성하여 곧바로 모델을 적용해 볼 수 있습니다.

직관적인 데이터 분석을 도와주는 다양한 도구들

- 데이터를 직관적으로 들여다 볼 수 있는 Lift chart, Feature impact, Reason code, Confusion matrix, Word cloud 등 다양한 가시화 방법들을 제공합니다.

- 예를 들어 Reason code를 사용하면 개별 레코드에 대한 예측 및 예측 근거를 설명할 수 있습니다.

동영상 자료

- DataRobot 소개

제 품문 의
top