안녕하세요 이번에는 ETL 그중에서도 TALEND OPEN STUDIO에 대해 소개해 드리려고 합니다 툴을 설치하고 다음 포스팅에는 DB데이터를 엑셀로 출력하는 과정을 소개하려고 합니다. 먼저 ETL과 TALEND가 생소하신 분들이 좀 계실텐데 TALEND는 시리즈 느낌으로 계속 포스팅 해볼테니 같이 공부하면 좋겠네요.
ETL
ETL은 조직에서 여러 시스템의 데이터를 단일 데이터베이스, 데이터 저장소, 데이터 웨어하우스 또는 데이터 레이크에 결합하기 위해 일반적으로 허용되는 방법이라고 구글 클라우드는 소개하고있네요. 그냥 간단하게 말해서 데이터를 추출 하고 그 데이터를 가공하고 다른 곳에 이관하는 시스템등을 얘기한다고 저는 이해했습니다. 여러 ETL 플랫폼중 저는 TALEND를 사용하였고 아마 다른 ETL플랫폼도 비슷한 구조일 것이라 생각합니다.
TALEND 시작전 준비
TALEND에서 만든 ETL툴입니다. 앞으로 모든 클라우드 GCP등의 DB이관 작업들을 이 툴로 할 생각입니다. 자바로 구성되어 있지만 자바를 전혀 몰라도 따라오시는데 문제가 없습니다. 코드가 아닌 UI적으로 구성되어 있기 때문입니다. 그러면 먼저 TALEND OPEN STUDIO를 시작하기전 설치부터 해야겠죠.
JAVA 설치
선행으로 JAVA가 없다면 JDK를 설치해 주셔야합니다. 링크는 https://www.oracle.com/java/technologies/downloads/#java8
JAVA 환경변수는 JAVA_HOME PATH를 설정해주시면 됩니다.
TALEND OPEN STUDIO 설치
JAVA를 설치하셨고 환경변수 설정까지 마치셨다면 TALEND OPEN STUDIO를 설치하시면 됩니다 이것도 링크 첨부해드립니다. https://www.talend.com/products/talend-open-studio/ 이메일등 여러 정보를 입력하는데 아무렇게나 입력하셔도 됩니다.
Create a new project를 누르고 프로젝트 이름을 정해서 만들고 Finish를 누르면
해당창이 나오면 성공입니다. 다음 포스팅에는 DB to Excel에 대해 작성해 보겠습니다.
'개발' 카테고리의 다른 글
(ETL) TALEND OPEN STUDIO DB 데이터 엑셀로 출력하기(MSSQL) (0) | 2022.05.18 |
---|---|
sklearn 사이킷런 SVM모델 그래프 그리기 (margin, decision boundary) (0) | 2022.05.16 |
파이썬 머신러닝 Ensemble voting 기법 예제(KNeigborsClassifier,DecisionTree,KFold,SVM) (0) | 2022.05.11 |
파이썬 keras layers LSTM 간단한 예제 (0) | 2022.05.11 |
파이썬 DB연결 (pymssql - insert select update 예제) (0) | 2022.05.10 |
댓글