IT/Bigdata (2) 썸네일형 리스트형 02. 하둡 개발 준비 SSH(Secure Shell) : SSH로 다른 서버에 접근할 때 IP혹은 호스트명으로 접속 가능 01. 하둡 살펴보기 01. 하둡 살펴보기1.1 빅데이터의 시대1.1.1 빅데이터의 개념-빅데이터의 3대 요소 (3V) : 크기(Volume), 속도(Velocity), 다양성(Variety)1.1.2 빅데이터의 출현 배경 1.2 하둡이란?-대용량 데이터를 분산 처리할 수 있는 자바 기반의 오픈소스 프레임워크-하둡의 탄생 : GFS(Google File System) + Mapreduce (더그커팅)-HDFS : 하둡 분산 파일 시스템-Mapreduce : 분산 처리 시스템으로 데이터 처리1.2.1 왜 하둡인가?1. 웹 로그 같은 비정형 데이터를 저장하기 위함.2. 오슨소스 프로젝트로 라이선스 부담이 없음3. 데이터 복제본을 저장하여 제이터 유실이나 장애에 복구 가능4. 여러 대의 서버에 데이터를 저장하고, 데이터가 저장된 .. 이전 1 다음