Pentaho란?
Pentaho는 데이터 수집, 가공, 분석, 대시보드까지 구현한 수 있는 오픈소스 BI 도구이다.
데이터 시각화도 할 수 있는 빅데이터 분석 도구라도 봐도 된다.
굉장히 많은 기능을 포함한 좋은 도구여서 그런지 2015년에 히타치에 인수되었다.
본 문서에서 "DB 데이터 전환"에서는 Pentaho에 있는 많은 기능 중에 Data Integration 기능 만을 사용한다.
Pentaho Data Integration 특징
- Java 기반 오픈소스 소프트웨어이다. (소스는 https://sourceforge.net를 통해서 공개하고 있다)
- 다양한 데이터 소스를 사용할 수 있다. (예: DBMS(Oracle,MS-SQL,MySQL 등), csv, Hadoop 등)
- 문자가 잘 깨지지 않고 전환된다. (예: 이모티콘문자, 중국어 간체 등 utf8 확장형 문자)
- Pentaho Data Integration의 주요 프로그램
- Spoon : UI를 제공하는 프로그램으로 Job 및 Transformation을 설계하고 테스트, 혹은 실행할 수 있다.
- Pan : 커맨드 라인용 프로그램으로 이미 작성된 Job이나 Transformation을 실행하는 데 사용할 수 있다.