Pentaho란?

Pentaho는 데이터 수집, 가공, 분석, 대시보드까지 구현한 수 있는 오픈소스 BI 도구이다.

데이터 시각화도 할 수 있는 빅데이터 분석 도구라도 봐도 된다.

굉장히 많은 기능을 포함한 좋은 도구여서 그런지 2015년에 히타치에 인수되었다.

본 문서에서 "DB 데이터 전환"에서는 Pentaho에 있는 많은 기능 중에 Data Integration 기능 만을 사용한다.

  • Pentaho Data Integration 특징

    • Java 기반 오픈소스 소프트웨어이다. (소스는 https://sourceforge.net를 통해서 공개하고 있다)
    • 다양한 데이터 소스를 사용할 수 있다. (예: DBMS(Oracle,MS-SQL,MySQL 등), csv, Hadoop 등)
    • 문자가 잘 깨지지 않고 전환된다. (예: 이모티콘문자, 중국어 간체 등 utf8 확장형 문자)

  • Pentaho Data Integration의 주요 프로그램
    • Spoon : UI를 제공하는 프로그램으로 Job 및 Transformation을 설계하고 테스트, 혹은 실행할 수 있다.
    • Pan : 커맨드 라인용 프로그램으로 이미 작성된 Job이나 Transformation을 실행하는 데 사용할 수 있다.

results matching ""

    No results matching ""