멀티캠퍼스

통합검색

검색도우미 기능을 다시 켤때는
검색창에서 검색도우미 열기를 클릭하세요

과정상세

[ProDS] R을 활용한 데이터 분석_중급

thumbnail image
집합

중급

[ProDS] R을 활용한 데이터 분석_중급

0

like 0

1,300,000원 (VAT없음)

과정요약

과정요약
학습시간 40시간 난이도 중급
교육비 지원 고용보험 비환급 평가항목 출석률 100%
수료기준 총점 80점 이상시 수료 정원 24 명

과정소개


※ 본 과정은 ProDS 인증에서 다루고 있는 평가과목의 교육내용/수준으로 진행되며, 자격응시는 포함되어 있지 않습니다.

- 통계지식부터 데이터마이닝까지, R로 하는 데이터 분석
: 빅데이터 분석 및 활용을 위해 필요한 수학, 통계지식을 알고 R로 분석하고자 합니다.

- R 배우고 ProDS자격의 DS등급 실기에 도전
: 교육내용은 ProDS자격DS등급 실기분야(R선택)의 과목들에 해당되어 응시를 위한 준비가 가능합니다.

※ 본 과정의 목표 달성을 위해서는 사전지식을 필요로 하오니, 수강 전 꼭 확인 부탁드립니다.

- 멀티캠퍼스의 <통계 및 머신러닝>을 수강하였다.
또는
- 아래 내용 중 3개 이상 충족한다.
  . 기초 통계(확률, 분포, 추정/검정 등) 및 회귀분석에 대해 알고 있다.
  . 데이터마이닝의 개념과 종류에 대해 알고 있다.
  . ADsP 자격을 보유하고 있거나 ProDS DS등급 필기에 합격하였다.
  . R 기본적인 사용방법(데이터 프레임 생성과 핸들링 등) 및 기본 산술함수(mean, var 등)를 알고 있다.

학습목표

  • 데이터 분석에 필요한 각 요소 기술들에 대해 이론적으로 이해하고 구현할 수 있는 적절한 기법을 파악할 수 있다.
  • 데이터 처리, 통계, 머신러닝의 이론을 알고 분석툴 R을 활용하여 분석할 수 있다.
  • 데이터분석 실전문제를 통하여 실제 업무에서 접할 수 있는 다양한 이슈들을 알고, 해결할 수 있는 방법론들에 대해서 알 수 있다.

학습대상

  • 데이터 분석 관련 업무 담당자
  • 통계와 머신러닝 기법 중심으로 데이터 분석을 해보고 싶은 사람
  • ProDS자격 DS등급 취득 응시자
  • R로 데이터 전처리부터 시각화까지 데이터 관련 전 프로세스를 정확하게 배우고 싶은 분

과정목차 31

  • 1 일차
    • 데이터 과학의 개요
      • 데이터 과학이란?
        데이터 과학의 구체적사례
        - 국가별 경제 수준과 의료 수준 동향
        - 주택 가격 예측
        - 두 수면제의 효과 비교
        - 웹 사이트 개선을 위한 A/B 테스트
        데이터 분석 프로세스
        데이터 과학자에게 필요한 역량
    • 데이터 분석 환경 구성
      • R과 RStudio 설치
        R 라이브러리 관리
    • 데이터 취득
      • 데이터 과학 학습용 데이터
        - R datasets
        - UCI 머신러닝 리포지토리
        - Kaggle 등
    • 데이터 취득
      • 파일 읽어 들이기
        - read.table, read.csv 함수 활용
        - data.table, readxl, DB 관련 패키지 활용
    • 피보팅
      • -reshape2 패키지 활용(cast(), melt())
    • 반복문 대체
      • - ifelse()
        - apply()
  • 2 일차
    • 데이터 병합
      • - 기본함수
        - sqldf 패키지
        - dplyr 패키지
    • dplyr 패키지 활용
      • 관측치 선택, 정렬
        변수 선택, 변환
        요약 통계량 계산
        랜덤 샘플링
        유일 값 계산
        그룹 연산
        조인 연산
        합집합
    • 들어가며
      • 통계의 개념
        표본
        확률
    • 통계량
      • 기초통계량
        사분위수와 상자그림
        변동계수
    • 가설검정Ⅰ
      • 가설 검정 절차
        분할표
        분할표 해석
    • 추론 통계
      • 점추정
        구간 추정
        모평균/모비율 신뢰구간
    • 포본 추출
      • 확률적 표본 추출
  • 3 일차
    • 포본 추출
      • 비확률적 표본 추출
    • 분포
      • 확률변수
        확률질량함수/확률밀도함수/확률누적함수
        분포의 종류
        정규 분포
        첨도/왜도
    • 이상치/결측치
      • 이상치
        결측치
    • 가설검정Ⅱ
      • 비율검정
        등분산검정
    • 가설검정Ⅱ
      • 상관계수검정
        - 피어슨 상관계수
        - 순위 상관계수
        t-검정
        분산분석
    • 시각화의 중요성 자료의 표현 잘못된 시각화 사례 관련 언어 및 도구
      • table vs. plot
        자료 표현의 3요소
        bbc
        관련 언어 및 도구
    • ggplot2
      • 각종 그래프
        기초 문법
        산점도/선그래프/막대그래프
  • 4 일차
    • 그래프 세부 설정
      • 선색상
        면색상
    • 기본 데이터 분석 단변량 분석 다변량 분석
      • 데이터의 이해
        요약 통계량
        데이터의 분할
        정보의 속성에 따른 접근
        다차원 정보의 표현
    • 시계열 데이터 시계열 데이터의 생성 시계열 데이터의 추출 평활화
      • 추세변동
        순환변동/계절변동
        불규칙변동
        기본함수 활용
        내장함수
        lubridate 패키지 활용
        단순이동평균
        가중이동평균
        지수가중이동평균
    • 데이터 전처리
      • 관련 패키지
        사용자 정의 함수
        정규표현식
    • 선형 회귀 단순 선형 회귀 다중 선형 회귀 회귀 모델의 평가 순서형 변수의 활요 명목형 변수의 활용 변수 선별 종합 해석
      • 선형 회귀 모델의 종류
        관련 가정
        모델 수식과 평가지표
        회귀 모델의 가설검정
        결과 해석
        회귀 모델의 가설검정
        결과 해석
        잔차 분석
        다중 공선성
        예측값 산출
        예측값 평가
        순서형 변수의 해석
        명목형 변수의 변환
        가변수 생성
        AIC
        해석 및 평가
    • 연습문제
      • 자동차 가격 데이터
        자전거 대여 데이터
    • 모델 상세 구현 로지스틱 회귀 모델의 평가
      • 모형 수식
        로짓 변환
        승산(Odds)
        승산비(Odds Ratio)
        glm() 함수의 사용
        예측값 산출
        다양한 평가지표
        분할표 해석
        ROC 곡선
        AUC
  • 5 일차
    • 종합 해석 연습문제
      • 해석 및 평가
        경마데이터
    • 의사결정나무 Random Forest
      • 의사결정나무의 특징
        Gini Index
        정의 및 특징
    • k-평균 군집 계층적 군집 분석
      • 예제코드
        결과 및 해석
    • 자전거 대여 데이터 경마 데이터 항생제 처방 데이터 고속도로 통행량 데이터
      • 실습

수강후기 0

평균평점

0 / 5.0

  • 등록된 수강후기가 없습니다

[ProDS] R을 활용한 데이터 분석_중급 관련과정