과정상세
[BigData] 빅데이터 분석을 위한 하둡(Hadoop)과 스파크(Spark) 아키텍처

교재제공 중급
[BigData] 빅데이터 분석을 위한 하둡(Hadoop)과 스파크(Spark) 아키텍처
과정요약
학습시간 | 34시간 | 난이도 | 중급 |
---|---|---|---|
교육비 지원 | 고용보험 비환급 | 평가항목 | 출석률 100% |
수료기준 | 총점 80점 이상시 수료 | 정원 | 24 명 |
교재정보 |
과정소개
학습목표
- 빅데이터 분석을 위한 소프트웨어 아키텍처를 이해할 수 있다.
- 하둡 에코시스템을 이해하고 협업에 적용점을 찾아 하둡을 활용 할 수 있다.
- 빅데이터 분석을 위한 하둡 아키텍처부터 실시간 데이터 분석을 위한 람다아키텍처를 이해할 수 있다.
학습대상
- 기업 내 정보화 및 IT혁신사업 담당자
- 기업의 전산시스템 및 데이터 관리 담당자
- 빅데이터에 관심 있는 재직자
과정목차 28
-
1 일차
-
Chapter 1. 빅데이터 개념
- 빅데이터 개념 이해 및 빅데이터 처리 과정 이해
-
Chapter 1. 빅데이터 개념
-
.
- 빅데이터 관련(수집, 저장, 처리, 분석, 시각화) 기술 이해
- 하둡 소개
- 하둡 아키텍처 / HDFS 저장구조 및 Mapreduce 동작 원리
- 하둡을 이용한 빅데이터 환경 구성
- 하둡 설치 및 설정 / 하둡의 HDFS 명령어 / 홀튼웍을 이용한 가상 분산 환경 구성
-
Chapter 3. 로그 기반 빅데이터 수집
- 로그 기반 빅데이터 수집
- Flume 설치 및 응용
- 관계형 데이터베이스 기반 빅데이터 수집
- MySQL 및 SQOOP 설치 및 응용
- 인터넷 기반 빅데이터 수집
- Crawling 응용 및 워드 카운트
-
Chapter 4. 스파크 및 비정형 데이터베이스
- 스파크 및 비정형 데이터베이스 소개
- 스파크 아키텍처 및 NoSQL
- Pig를 이용한 병렬처리 기술
- Pig 설치
- Pig 기초 및 응용
- Hive를 이용한 병렬처리 기술
- Hive 기초 및 응용
-
Chapter 5. R
- R프로그래밍 기반 빅데이터 분석 프로젝트
- R 기초 및 고급 문법
- R 기반 빅데이터 분석
- R 기반 머신러닝
-
Chapter 6. Python & Tensorflow
- Python 프로그래밍 기반 빅데이터 분석 프로젝트
- Python 기초 및 고급 문법
- Python 기반 빅데이터 분석
- Python 기반 머신러닝
- Tensorflow 소개
수강후기 174
-
4******
2019.08.30
중식 퀄리티가 예전 식당(역삼)보다 못해요. -
4******
2019.08.30
빅데이터 아키텍쳐, 트렌드 파악할 수 있어 좋았어요. -
4******
2019.08.30
강의장 환경은 좋았지만 너무 추웠습니다. -
4******
2019.08.30
예제와 실습 위주라서 이해하기 쉬웠습니다. 하지만 프로그램 설치나 R, 파이선 등 기본 문법에 대한 것보다 빅데이터를 다루는 실습 예제가 더 많았으면 하는 아쉬움이 있습니다. -
5******
2019.08.30
빅데이이터 전반을 알수 있었다.