본문 바로가기

IT

Nifi

NiFi

- 클러스터 간 데이터 동기화

- Apache 오픈소스

- 분산 환경에서 대량의 데이터를 수집, 처리

- 실시간 ETL

- FBP(Flow-Based Programming)


특징

- 실시간 처리 : 특정 디렉토리에 파일이 생성되면 바로 다른 DB에 저장하거나 다른곳으로 FTP로 보낼 수 있음.

- Zero Master 클러스터 환경 제공, 확장 가능

- HTTPS 보안

- 데이터의 이동경로 추적 가능

- 데이터 교환


단점

- 배치작업 불가

- 복잡한 연산 불가


구성 요소

- FlowFile : 데이터 단위

- Processor : FlowFile을 수집, 변형, 저장하는 기능

- Connection : Processor 끼리 연결해 FlowFile을 전달


  • FlowFile
    • 속성(Attribute) : key-value 형태로 데이터의 이동 및 저장 시 필요한 정보
    • 내용(Content) : 데이터가 어디에있는지 포인트 정보를 가지고 있음
  • Processor
    - 150개가 넘는 Processor를 제공하고 확장 가능
  • Connection
    - FlowFile의 대기열(Queue) : FlowFile의 우선순위, 만료, 부하 조절 기능 제공


'IT' 카테고리의 다른 글

제2장 컨테이너 가상화 기술과 Docker  (0) 2018.05.15
PostgreSQL  (0) 2018.05.02