과정상세
Data Scientist를 위한 R기반 통계 입문

교재제공 초급
Data Scientist를 위한 R기반 통계 입문
카테고리
- 학습유형별 대면
- 데이터 사이언스 데이터 분석
과정요약
학습시간 | 09:30 ~ 17:30 ( 35시간 ) | 난이도 | 초급 |
---|---|---|---|
교육비 지원 | 고용보험 비환급 | 평가항목 | 출석률 100% |
수료기준 | 총점 80점 이상시 수료 | 정원 | 24 명 |
교재정보 | |||
강사명 | 박혜정 |
과정소개
학습목표
- R을 활용하여 기초적인 데이터 분석을 할 수 있다.
- 데이터를 탐색하고 데이터 분석 목표에 맞게 진행방향을 수립할 수 있다.
- 통계학의 기본 개념과 용어를 학습하고 데이터의 통계적 흐름을 알 수 있다.
- 분석 목적에 맞는 분석 방법을 선택하고 분석 결과에 대해 해석할 수 있다.
- 데이터 검증, 정제, 전 처리를 통해 분석에 용이한 데이터(Tidy Data)를 구축할 수 있다.
- 예측 모형 설계와 결과 해석을 통한 적용방안을 탐구할 수 있다.
학습대상
- 데이터 분석을 위해 통계 기초를 알고 싶은 분
- 현재 데이터 분석 업무를 하고 있지만, 주요 개념과 이론에 대한 이해가 부족한 분
- Data Scientist로 성장하길 원하는 분
- R을 이용한 데이터 분석에 관심이 있는 분
- 프로그래밍 경험 있으신 분
- 업무 중 집계 즉, 기초통계로 한번이라도 업무 경험 있으신 분
-
-
1일차
-
.
- R 기반의 데이터 분석을 위한 환경 구축 09:30 ~ 10:30
-
.
- R 데이터 타입 : 정수, 실수, 문자, 논리값, 결측치
연산자 10:30 ~ 11:30
- R 데이터 타입 : 정수, 실수, 문자, 논리값, 결측치
-
.
- R 자료구조 : 상수, 벡터 11:30 ~ 12:30
-
.
- R 자료구조 : 매트릭스, 어레이 13:30 ~ 14:30
-
.
- R 자료구조 : 데이터프레임, 리스트 14:30 ~ 15:30
-
.
- 외부데이터 불러오기
factor 함수를 활용한 그룹변수 지정
외부데이터 불러오기 및 원하는 포맷으로 저장하기 15:30 ~ 16:30
- 외부데이터 불러오기
-
..
- 통합실습 및 Review 16:30 ~ 17:30
-
.
-
2일차
-
.
- 결측치 데이터 처리 09:30 ~ 10:30
-
.
- 조건에 따른 데이터 처리 제어 : if, for, while, ifalse 등 10:30 ~ 11:30
-
.
- 사용자 정의함수 11:30 ~ 12:30
-
.
- 데이터 전처리 : apply 계열 함수 13:30 ~ 14:30
-
.
- 데이터 표 요약 14:30 ~ 15:30
-
.
- 데이터 차트 요약 15:30 ~ 16:30
-
..
- 데이터 차트 요약 16:30 ~ 17:30
-
.
-
3일차
-
.
- 통계학이란? 09:30 ~ 10:30
-
..
- 기술통계학 : 수치 데이터 요약 10:30 ~ 11:30
-
.
- 기술통계학 : 표/차트 데이터 요약 11:30 ~ 12:30
-
.
- 확률 / 확률변수 및 분포 13:30 ~ 14:30
-
.
- 샘플링 : 모집단 및 표본 14:30 ~ 15:30
-
.
- 추측 통계학 : 대표값 추정 15:30 ~ 16:30
-
.
- 검정 / 수치형 단일 모집단 검정 16:30 ~ 17:30
-
.
-
4일차
-
.
- 수치형/비수치형 두 모집단 차이 검정
ttest를 이용한 수치형 두 모집단의 차이 검정
카이제곱 검정을 이용한 비수치형 변수들의 독립성, 적합성 검정 09:30 ~ 10:30
- 수치형/비수치형 두 모집단 차이 검정
-
.
- 수치형 세 개이상 집단 간의 차이 검정
분산분석(ANOVA)/요인분석
일원분산분석
다중비교(사후비교)
분산분석 가정 확인
모집단들의 등분산 검정
이원분산분석
상호작용
다중비교 10:30 ~ 11:30
- 수치형 세 개이상 집단 간의 차이 검정
-
.
- 수치형 세 개이상 집단 간의 차이 검정
분산분석(ANOVA)/요인분석
일원분산분석
다중비교(사후비교)
분산분석 가정 확인
모집단들의 등분산 검정
이원분산분석
상호작용
다중비교 11:30 ~ 12:30
- 수치형 세 개이상 집단 간의 차이 검정
-
.
- 상관관계 및 인과관계
변수 간의 상관 관계 분석
회귀분석
단순선형회귀분석 13:30 ~ 14:30
- 상관관계 및 인과관계
-
.
- 의미있는 변수간 인과관계
다중선형회귀분석
의미있는 변수 선택
다중 공선성 14:30 ~ 15:30
- 의미있는 변수간 인과관계
-
.
- 인과관계(회귀분석) 모형 찾기 실습 15:30 ~ 16:30
-
.
- 상관관계 및 인과관계 16:30 ~ 17:30
-
.
-
5일차
-
.
- 많은 변수 중 의미있는 변수를 찾아 인과관계 찾기 09:30 ~ 10:30
-
..
- 의사결정시스템(로지스틱 회귀) 10:30 ~ 11:30
-
.
- 분류분석을 통한 의사결정 11:30 ~ 12:30
-
.
- 와인에서 추출된 정보로 와인 품종 예측
13:30 ~ 14:30
- 와인에서 추출된 정보로 와인 품종 예측
-
.
- 신용 데이터를 이용한 고객 구분하기 14:30 ~ 15:30
-
.
- 의사결정트리 성능 개선시킨 랜덤포레스트 활용하기 15:30 ~ 16:30
-
.
- 신용 데이터를 이용한 고객 구분하기 16:30 ~ 17:30
-
.
-
1일차
수강후기 45
-
5임*래
2024.04.19
R을 이용해서 통계 데이터 활용에 도움이 될것 같습니다 -
5이*민
2024.04.19
업무에 활용할 수 있는 데이터 코드들을 배울 수 있었습니다. -
4.5윤*호
2024.04.19
R 통계 사용으로 업무활용이 가능해졌습니다. 감사합니다. -
4.5지*재
2023.08.11
자세하게 설명해주셔서 잘 이해갔습니다 -
4남*용
2023.08.11
교재가 혼자봐도 이해 할 만큼 더 자세하게 설명되었으면 좋겠습니다 . PDF 말고 제본(스프링철)으로 주셨으면 좋겠습니다.
Data Scientist를 위한 R기반 통계 입문 관련과정

교재제공

교재제공