알지오 평생교육원

로그인|회원가입|고객센터
HOME>IT전문가>데이터베이스>R 빅데이터 통계/시각 [입문+실무]

R 빅데이터 통계/시각 [입문+실무]

R 빅데이터 통계/시각 [입문+실무]
20회차 속성과정
전체 : 18시간 49분|회차당 평균 : 56분27초

이용기간 2개월

전문강사 : 알지오 R&D [IT]

300,000185,000



R 빅데이터 통계/시각 인강 평생교육원 교육 안내
R 프로그래밍 언어(R)는 통계 계산과 그래픽을 위한 프로그래밍 언어이자 소프트웨어 환경입니다. R은 통계 소프트웨어 개발과 자료 분석에 널리 사용되고 있으며, 패키지 개발이 용이하여 통계학자들 사이에서 통계 소프트웨어 개발에 많이 쓰이고 있습니다. 알지오 R프로그래밍 강좌를 통해 R프로그래밍의 모든 부분에 대해서 학습할 수 있습니다.
  • 01.42분 확률분포(연속형 확률분포)

    정규분포, 지수분포, 균등분포, t-분포, 신뢰구간의 의미에 대해서 설명합니다.

    책갈피 : [00:04] R_programming 설명/[05:07] X축에 들어갈 확률변수값지정/[16:14] 그래프 예제/[26:10] Layout 함수 사용 //[33:32] 지수분포의 누적분포함수사용방법/[43:13] T분포/[50:14] Upper, lower 실현/[57:05] 예제 코드 실행

  • 02.1시간 1분 확률분포(이산형 확률분포)

    베르누이 분포, 이항분포, 포아송 분포, 초기하분포, 일변량 데이터의 정리, 범주형 데이터를 위한 막대그림, 파이그림, 점그림, 연속형 데이터를 위한 그래프, 줄기-잎 그림, 상자그림

    책갈피 : [00:07] 이산형 확률분포/[06:42] 예제코드 실행/[14:15] 그래프의 plot값 /[27:13] m=5 :n=10: p=m/(n+m)일 경우/[36:39] State.region 데이터 내용/[43:29] State.region데이터 이용 pie그래프생성/[50:49] as.numeric 도수 분포표에 속성변경/[56:02] 상자그림 그래프/[01:00:54] my-box=boxplot(gross)객체할당

  • 03.57분 연속형 데이터를 위한 그래프, 데이터의 요약통계, 일변량 데이터

    상자그림, 히스토그램, 커널밀도추정그림, 데이터 중심에 대한 요약통계, 데이터 퍼짐에 대한 요약통계, 일변량 데이터와 관련된 통계적 추론, 모평균에 대한 검정 및 신뢰구간 추정, 모비율에 대한 검정 및 신뢰구간 추정, 정규성 검정, 분포중심에 대한 비모수 검정

    책갈피 : [00:04] My_box 변수의 할당량 출력/[05:33] 각 구간의 개수를 계산하는 알고리즘을 칭하는 문자열/[11:23] 기본 plot함수 실행/[20:54] Airquality변수인 Ozone/[28:22] 사분위범위(Interquartile range)/[34:27] 95% 신뢰구간 계산/[40:20] 1x2 행렬(성공횟수, 실패횟수)/[49:37] Shapiro.test() 함수/[55:06] Shapiro.test(log(price))/[56:26] Wilcoxon signed rank

  • 04.1시간 1분 이변량 범주형 데이터

    도수분포표 작성, 이변량 범주형 데이터를 위한 그래프, 상자그림, 커널밀도추정 그림, 평균 막대그림, 연속형 변수의 분포 비교를 위한 요약통계, 산점도 작성, 상관계수 계산

    책갈피 : [00:13] Wilcox.test 사용방법/[05:31] 분할표 작성/[10:24] 2차원 분할표의 한계분포(marginal distribution)작성/[16:23] 예제코드 실행/[21:06] 예제코드 실행/[30:56] 겹쳐 그린 커널밀도추정그림/[41:13] 예제코드 실행/[50:42] Abline함수/[57:24] 두 범주형 변수의 독립성 검정/[59:21] Monte carlo 모의실험

  • 05.57분 이변량 데이터와 관련된 통계적 추론, 회귀분석

    카이제곱 독립성 검정, Fisher의 정확검정, 두 모집단의 모비율 차이에 대한 검정, 신뢰구간 추정, 두 모집단의 모평균 차이에 대한 검정 및 신뢰구간 추정, 두 모집단의 중심차이에 대한 비모수 검정, 회귀분석, 단순선형회귀모형, 다중선형회귀모향

    책갈피 : [00:07] 카이제곱 독립성 검저/[05:49] 오즈비(odds ratio, OR)/[14:21] Fisher 정확검정 예제코드 실행/[22:10] 예제코드 실행/[30:43] 귀무가설 = 분산1/분산2=1/[40:54] 경고문구 출력/[50:41] 다중선형회귀모형/[56:59] 종속변수 murder과 독립변수 지정

  • 06.56분 다중선형회귀모형

    회귀모형의 추론, 회귀모형의 anova표 사용, 회귀진단 및 대안탐색, 회귀모형의 가정 만족여부 확인, 동일분산 가정 확인, 정규분포가정 확인, 독립성 가정 확인, 선형관계 확인, 다중공선성 확인에 특이한 관찰값 탐지

    책갈피 : [00:07] 다중선형회귀모형/[05:25] 효과에 따른 변동, 오차 변동/[16:22] n차 다항회귀 모형 설정/[27:01] 결과 확인/[37:21] 다중 공선성/[50:13] Cook's Distance/[54:23] 코드 수행

  • 07.55분 대안 탐색

    종속변수의 변환, 독립변수의 변환, 변수의 선택, 검정에 의한 방법, 모형선택 기준에 의한 방법, 최근접 이웃을 사용한 분류, 정의, KNN알고리즘

    책갈피 : [00:10] 잔차/[05:06] 코드 수행/[16:01] 함수적용결과/[29:55] population, Area, illiteracy/[38:56] 빅데이터/[45:08] 회귀개수가 여섯개인 모형/[50:48] 기계학습/[53:37] KNN알고리즘

  • 08.54분 최근접 이웃을 사용한 분류

    KNN알고리즘을 활용한 유방암 진단, 나이브 베이즈를 사용한 분류, 베이즈 이론, SMS 메세지 필터

    책갈피 : [00:12] dist 함수/[05:50] uci기계학습 저장소 사이트/[13:49] 간단한 백터로 함수 수행/[24:22] scalse함수 적용 결과보기/[32:49] Viagra/[42:15] 텍스트 처리에 필요한 방법/[51:05] 빈도매트릭스에서의 표현

  • 09.57분 결정트리와 규칙을 사용한 분류

    결정트리의 이해, 결정트리의 활용 예시, 결정 트리의 가지치기, C5.0결정 알고리즘, 결정트리를 이용한 은행 대출관리

    책갈피 : [00:02] 단어 클라우드/[05:27] findFreqTerms/[14:18] prop.t/[25:09] 결정트리의 속성구분 특징/[33:41] view all data sets/[41:04] 데이터 분류 코드 수행/[51:19] C5.0함수의 부스팅/[55:49] 패널티를 적용한 모델 결과

  • 10.54분 규칙학습자 & 회귀기법

    규칙 학습자의 이해, 독버섯 식별을 위한 실습, 회귀 이해, 선형 회귀를 사용한 의료비 예측 실습

    책갈피 : [00:02] 규칙학습자/[06:21] 규칙학습자 알고리즘 적용 수행 결과/[13:59] 틸트 연산자/[24:47] 단순 선형 회귀/[33:10] cor/[42:14] 더미 코딩/[50:16] bmi항목

  • 11.58분 수치 데이터의 예측 회귀기법 & 인공 신경망 알고리즘

    인공 신경망 알고리즘의 이해, 인공신경망 알고리즘을 이용한 콘크리트의 내구력 모델 학습/인공 신경망 알고리즘의 이해, 인공신경망 알고리즘을 이용한 콘크리트의 내구력 모델 학습

    책갈피 : [00:02] 수치예측 트리 알고리즘 살펴보기/[05:06] 표준편차리덕션/[14:53] fallen.leaves=T/[23:58] 생물학적 뉴런/[36:51] 쌍곡선탄젠트 함수/[47:09] 과적합/[54:15] lapply를 사용한 코드 수행

  • 12.58분 인공신경망 알고리즘 & 서포트 벡터 머신

    콘크리트의 내구력 모델의 실습, 서포트 벡터 머신의 원리, 광학식 문자 인식 실습

    책갈피 : [00:02] concrete_norm/[06:31] compute함수/[17:46] 벡터 기하학/[26:19] ksvm함수//[34:44] Cost Value/[40:52] RBF커널 사용/[51:56] k평균 알고리즘의 속성값/[56:09] 엘보우 기법

  • 13.54분 K평균을 이용한 군집화 & 연관규칙

    K평균을 이용한 잠재 고객 분류 실습, 연관규칙의 이해, 연관 규칙을 이용한 실습 데이터 학습

    책갈피 : [00:01] k평균을 이용한 잠재고객 분류실습/[05:50] as.data.frame/[12:00] betweenss/[18:18] ifelse함수/[30:09] friends~cluster/[42:23] 병문안카드->꽃 신뢰도 계산/[52:13] inspect함수

  • 14.54분 연관규칙 & 모델 성능 평가

    연관 규칙을 이용한 실습 데이터, 정확도와 오차율, 카파통계, 민감도, 특이도, 정밀도, ROC 커브

    책갈피 : [00:00] 통계값을 시각화하는 함수/[06:11] sample을 이용한 랜덤효과/[15:59] Inspect함수/[25:55] 모델성능 평가 방법/[30:48] confusionMatrix/[41:07] caret패키지

  • 15.58분 모델 성능 평가 & 데이터의 시각화(1)

    샘플링 방법, 파라미터 조절, 메타학습을 활용한 모델 성능 향상, ggplot 함수의 기본적인 사용 방법, 산점도, 선 그래프, 막대 그래프

    책갈피 : [00:02] 모델성능 향상방법/[00:18] 샘플링 방법/[06:42] 코드 수행 결과/14:48] 교차검증과 부트스트랩의 차이점/[31:04] bagging방법/[41:55] mtcars 데이터프레임 내용 살펴보기/[49:33] breaks인자의 다양한 활용/[55:26] BOD 데이터프레임 코드 수행 결과

  • 16.59분 데이터의 시각화(2)

    막대그래프의 모양 수정, 누적 막대 그래프, 비율 누적 막대 그래프, 클리블랜드 점 그래프

    책갈피 : [00:00] 여러그룹의 막대그래프 그리기/[00:09] cabbage_exp 살펴보기/[01:01] x, y, fill/[05:27] uspopchange데이터 살펴보기/[13:54] stack, identity/[25:18] 누적 막대그래프/[35:16] geom_text/[41:36] 누적 막대 그래프/[51:19] theme/[58:11] y축 명칭의 재정렬

  • 17.53분 데이터의 시각화(3)

    클리블랜드 점 그래프, 선 그래프, 축 정보 변경하기, 여러 그룹 선 그래프, 그래프에 음영 채우기, 신뢰 영역 추가, 산점도, 산점도, 적합된 회귀선 추가

    책갈피 : [00:01] facet_grid/[01:07] free_y/[06:51] ylim, scale_y_continuous/[15:15] group=supp/[28:16] 코드 수행 결과/[36:16] 도형의 모양과 채우는 방식을 다르게 표현하기/[43:24] 연속변수를 크기에 대입한 결과/47:30] 선형 모델로 데이터 적합/[52:04] 외삽법을 이용할 경우

  • 18.1시간 3분 데이터의 시각화(4)

    이미 만들어진 모형의 적합선 추가하기, 그래프의 주석 및 라벨 추가하기, 데이터의 분포 요약, 히스토그램, 밀도곡선, 박스플롯

    책갈피 : [00:02] 만들어진 모형의 적합선 추가하기/[00:14] heightweight데이터 내용 확인/[05:33] 성별정보 산점도 그래프 보기/[14:21] 회귀분석 결과 살펴보기/[26:53] size를 바꾼 수행 결과/[38:53] 여러그룹을 히스토그램 생성하는 방법/[45:16] space="free"/[52:06] y=..density../[01:01:24] stat_summary

  • 19.59분 데이터의 시각화(5)

    윌킨슨 점그래프, 이차원 데이터의 밀도그래프 그리기, 주석, 텍스트 주석넣기, 선 추가하기, 부분 강조하기, 오차막대 추가하기, 축, 축 정보 변경, 눈금설정

    책갈피 : [00:01] geom_violin/[01:04] violin그래프/[05:05] 코드 수행 결과/[12:25] alpha=..density../[23:06] geom_abline/[31:26] 부분 강조하기(음영추가)/[39:04] 분할면에 주석 넣기/[47:14] 코드 수행 결과/[51:48] 코드 수행 결과/[58:34] 라벨과 눈금을 동시에 제거하는 코드 수행

  • 20.59분 데이터의 시각화(6)

    축, 눈금 라벨 변경, 축 라벨 변경, 축을 따라 선 표시, 범례위치 조절, 데이터 변형, 데이터 부분집합 취하기, 연속변수를 범주형 변수로 코딩, 집단별로 변형, reshape

    책갈피 : [00:02] 눈금 라벨 변경/[00:14] axis.text, axis.title/[04:25] 축을 따라 선 표시/[08:05] 가이드를 이용한 코드 수행 결과/[14:43] 설정값을 변경안 코드 수행 결과/[22:49] transform, mutate/[32:45] ddply/[41:03] 코드 수행 결과/[50:11] melt함수 적용/[56:14] 두개의 측정변수가 있는 경우






주소 : 경기 의정부시 시민로122번길 41-46, 2F|e-mail : help@alzio.co.kr|호스팅 제공자 : SK브로드밴드
회사명 : 알지오|대표 : 채명수|개인정보관리자 : 박진엽|사업자등록번호 : 217-90-17793|통신판매 제2008-0312호
SSL발급자 Equifax Secure Global eBusiness CA-1|Copyright since 2003ⓒalzio.co.,Ltd all rights reserved. SNS

* 중소기업진흥공단 신기술밴처지원

* 서울기술보증 제 20031501호