IT전문교육 의 리더!

HOME>IT전문가>데이터베이스>R 프로그래밍 [실무]

R 프로그래밍 [실무]

20회차 속성과정|전체 : 18시간 49분|회차당 평균 : 56분27초
R 프로그래밍 [실무] / 2개월
R 프로그래밍 [입문 + 실무] / 4개월
300,000 185,000
  • 전문강사 : 홍태우
강사약력 (Instructor Profile)
[현재] 한국과학기술원(KAIST) 바이오 및 뇌 공학과 박사 과정
[학력] 부산대학교 생명과학부 학사
    부산대학교 분자생물학과 학부 석사
    카이스트 계산유전체학(computarional genomics) 박사
[경력] 국가생명연구자원정보센터 (KOBIC)
    생명정보 (bioinformatics) 관련 대용량 데이터 분석
    차세대 생명정보학 교육 워크샵 통계청
R프로그래밍 통계청 강의수행
Study Guides
R 프로그래밍 언어(R)는 통계 계산과 그래픽을 위한 프로그래밍 언어이자 소프트웨어 환경입니다. R은 통계 소프트웨어 개발과 자료 분석에 널리 사용되고 있으며, 패키지 개발이 용이하여 통계학자들 사이에서 통계 소프트웨어 개발에 많이 쓰이고 있습니다. 알지오 R프로그래밍 강좌를 통해 R프로그래밍의 모든 부분에 대해서 학습할 수 있습니다.
 
  • 0142분 확률분포(연속형 확률분포)정규분포, 지수분포, 균등분포, t-분포, 신뢰구간의 의미에 대해서 설명합니다.

    책갈피 : [00:04] R_programming 설명/[00:54] 확률분포/[01:13] 연속형 확률분포/[01:22] 연속형 확률분포의 R명칭/[02:17] 정규분포(norm)/[02:26] 밀도 함수/[02:30] 누적분포 함수/[02:32] 분위수 함수/[02:33] 난수발생 함수/[02:52] 확률분포에 R명칭 적용/[03:12] 함수사용방법 정확히 알고싶을때/[03:18] 알컴애드창에 ?함수이름 설정/[03:30] 함수에 대한 설명 확인/[03:39] 필요한 인자 표시/[03:57] X확률변수값, mean값,sd값 필요/[04:27] 지정값 확인/[04:56] 예제보기/[05:07] X축에 들어갈 확률변수값지정/[05:22] 밀도값 Y축으로 설정/[05:27] 예제 코드 실행/[05:32] Seq 함수/[06:12] X값을 인풋으로 dnorm함수 수행/[06:22] 예제 코드 실행/[06:38] 예제 plot(x=x, y=dnorm(x))값 설정/[07:03] 예제 코드 실행/[07:40] 선타입변경 그림제목설정파라미터추가/[07:52] Type="l" main=그림제목 설정/[08:40] 예제2로 그래프그리기/[08:50] 알컴앤드창에 ?plot.function 입력/[09:01] Plot 함수는 curve 함수와 동일사용/[09:35] 예제2 plot(dnorm,-3,3)값 설정/[09:52] 예제 코드 실행/[10:13] 예제1 예제2 동시에 실행/[10:31] 동시사용시 par 함수 사용/[10:57] Par(mfrow) 예제보기/[11:47] Par(mfcol) 함수/[11:58] 예제 코드 실행/[12:14] 정규분포의 확률밀도함수/[12:28] Plot에 dnorm 함수에 평균인자, 표준편차 지정/[12:52] Plot에 dnorm 함수에 평균값, 표준편차값 지정/[13:12] 예제 코드 실행/[13:21] 사용한 파라미터 확인/[13:25] Ylab 함수/[13:50] Text와 mtext 함수비교설명/[14:34] Expression 함수 사용/[15:17] Cex파라미터/[15:58] 누적분포함수(pnorm)/[16:14] 그래프 예제/[16:53] 학률밀도함수와 누적분포함수의 관계/[17:09] 1차원 함수 수치접근 integrate/[17:19] 무한대(infinity)는 inf로 표시/[17:31] 예제1번 코드 실행/[17:52] 예제2번 lower.tail 옵션사용/[18:08] Lower.tail 사용결과 설명/[19:27] 예제2번 코드 실행/[19:40] 예제3번 pnorm코드를 그래프수행/[20:17] 예제3번 코드 실행/[20:29] 분위수 함수/[20:57] 실제 사용코드로 설명/[21:15] Qnorm 함수 사용/[21:27] 예제보기/[22:05] Qnorm 함수 적용/[22:54] 예제 코드 실행/[23:12] 난수 발생/[23:38] 1000개 랜덤한 샘플 추출코드/[24:01] 추출한 결과 x에 넣고 hist로 확인/[24:13] 예제 코드 실행/[24:54] 빈도수로 histogram 그리기/[24:57] Ferq=f로 지정으로 밀도그래프/[25:18] Histogram 값과 표준정규분포 겹치기/[25:34] Plot 함수에 add값 /[26:10] Layout 함수 사용 /[26:27] Matrix /[27:21] 지수분포/[27:38] 지수분포의 예/[28:28] 함수의 기본적인 사용방법/[28:50] Rate값/[29:22] 지수분포의 밀도함수 그래프 생성/[29:36] Plot 함수에 rate=3/[29:51] Plat 함수에 rate=2 col,lty 지정/[30:33] Plat 함수에 rate=1 col,lty 지정/[31:02] Legend 함수/[31:23] Legend 위치 지정/[31:41] Legend 내용 지정/[32:02] Legend 순서에 맞춰서 col, lty값 지정/[32:53] 예제 코드 실행/[33:32] 지수분포의 누적분포함수사용방법/[33:39] 정규분포와 지수분포의 누적분포함수 차이점/[34:15] 예제보기/[35:56] Pexp(q=5 ,rate=1/5,lower.tail) 코드 실행/[36:14] 예제문제값 변경/[36:38] Pexp(10,rate=1/5)-pext(5, rate-1/5) 코드 실행/[37:17] 균등분포/[38:26] 각분포들의 모수/[38:50] 예제보기/[39:00] Runif(n=25)/[39:40] 균등분포에 밀도함수 겹쳐서 생성/[40:09] Breaks 옵션/[40:20] 예제 코드 실행/[41:01] 예제 2번 수행/[41:20] M.list 벡터에 입력/[41:55] Mfrow로 2개의 행과 2개의 열로 나누기/[42:09] 예제 코드 실행/[43:13] T분포/[44:03] T분포의 확률밀도함수/[44:35] Plot 에 add 옵션 이용/[45:00] 각예제별로 col,lty 다르게지정/[45:15] 예제 코드 실행 /[46:04] 표본분포 모의실험/[46:34] 표본의 크기, 반복횟수 지정/[47:02] Xsample로 T값계산/[48:30] 예제 코드 실행/[48:55] 신뢰구간에서 신뢰계수의 의미 예제/[49:28] 신뢰계수/[50:14] Upper, lower 실현/[51:05] 신뢰구간구하기 모의실험/[51:49] Mu 평균판단 index 변수에 저장/[52:32] Mtext 지정/[52:55] 예제 코드 실행/[54:31] Segments 함수/[54:47] I,lower, i,upper 연결선 plot에 추가/[54:58] Egments r 기본사용방법/[55:25] Col,lty를 index값에 의존해 맞춤/[56:03] 예제 코드 실행/[57:04] 반복횟수 수정/[57:05] 예제 코드 실행/[57:25] Paste 함수

  • 021시간 1분 확률분포(이산형 확률분포)베르누이 분포/이항분포/포아송 분포/초기하분포/일변량 데이터의 정리/범주형 데이터를 위한 막대그림, 파이그림, 점그림/연속형 데이터를 위한 그래프/줄기-잎 그림, 상자그림

    책갈피 : [00:07] 이산형 확률분포/[00:12] 이산형 확률분포의 R명칭/[00:37] 이항분포(binnom)/[00:36] 이항분포의 모수 size/[00:46] prob/[00:54] 베르누이 시행의 조건/[01:36] 베르누이 시행 코드/[02:28] 코드 실행 /[03:28] 이항분포관련함수의 사용법/[03:52] 이항분포의 예제/[06:42] 예제코드 실행/[07:43] 확률문제를 dbinom,pbinom이용/[08:03] 성공횟수가 5번일 확률 예제/[08:26] 예제코드 실행/[08:44] 성공횟수가 6번 이하일 확률 예제/[09:31] 예제코드 실행/[09:43] 성공횟수가 7번 이상일 확률 예제/[11:12] 예제코드 실행/[11:49] n의 크기에 따른 이항분포의 밀도함수/[13:07] 실행코드값 그래프로 확인/[14:15] 그래프의 plot값 /[14:35] N=10 : p=0.2일 경우/[15:02] N=10 ; p=0.7일경우/[15:22] N=100 : p=0.2일 경우/[15:59] For문을 이용하여 그래프그리기/[17:08] 예제코드 실행/[17:45] 함수 Rbinom 베르누이 시행/[18:20] 코드 실행/[19:00] 포아송분포의 R함수 사용방법/[19:12] 지수분포(exp)/[19:29] 포아송분포(pois)/[20:27] lambda값/[20:45] 포아송분포와 관련된 확률문제/[21:36] ppois 함수/[22:44] 예제코드 실행/[23:54] 포아송분포 예제/[23:57] n=10; p=01일 경우/[24:10] n=100 ; p=0.01일경우/[24:30] 예제코드 실행/[24:55] 초기하분포(hyper)/[26:11] 초기하분포와 이항분포의 차이점/[27:04] 초기하분포 예제/[27:13] m=5 :n=10: p=m/(n+m)일 경우/[27:15] m=1000; n=2000일경우/[27:58] 예제코드 실행/[28:19] 물고기 개체수 추정 절차 예제/[30:35] p.1 변수/[30:53] Which.max 함수/[31:05] Which.max 함수 사용예제/[31:05] 예제코드 실행/[31:55] abline 함수/[32:29] 예제코드 실행/[33:14] 일변량 데이터관련 함수/[34:10] 일변량 범주형 데이터/[34:19] 명목형 데이터/[34:34] 순서형 데이터/[35:08] 막대그림 그래프(barplot)/[36:22] State.region 요인정보 사용예제/[36:39] State.region 데이터 내용/[37:19] 예제코드 실행/[37:46] Horiz=TRUE 옵션 사용/[38:05] 예제코드 실행/[38:19] 범주형 데이터가 factor인 경우/[38:51] state.region에 class함수 적용/[39:29] 예제코드 실행/[39:40] mtcars 데이터프레임 사용/[39:57] mtcars 데이터 내용/[40:59] names.arg 옵션사용/[41:32] 예제코드 실행/[41:56] 범주형데이터를 파이그림(pie)/[43:29] State.region데이터 이용 pie그래프생성/[43:55] 예제코드 실행/[44:49] pct사용/[44:59] 문자형백터 my.label이용/[45:19] pie에 col인자 적용/[45:40] 예제코드 실행/[46:02] plotrix 패키지 불러오기/[46:17] pie3D 함수/[46:39] 예제코드 실행/[46:52] explod 옵션/[47:18] fan.plot 함수적용/[47:27] 예제코드 실행/[48:19] 점그림(dotchart)/[49:13] pie그래프 예제를 이용할 경우 dotchart에 오류 확인/[49:40] table함수에 counts 속성살펴보기/[49:55] 예제코드 실행/[50:49] as.numeric 도수 분포표에 속성변경/[51:13] 예제코드 실행/[51:34] 일변량 연속형 데이터를 위한 그래프/[52:31] 줄기-잎 그림/[53:03] 줄기-잎 그림은 stem함수사용/[53:49] women데이터 프레임이용/[54:02] women데이터 불러오기/[54:21] Attach함수/[54:39] 예제코드 실행/[54:59] stem에 scale을 이용하여 그래프늘리기/[55:26] 예제코드 실행/[56:02] 상자그림 그래프/[56:57] 상자그림 표시형식 두가지/[57:38] 상자그림(boxplot)/[58:38] Alltime.moies 데이터사용/[58:51] 패키지 UsingR/[59:03] Alltime.moies 데이터 불러오기/[01:00:17] 예제코드 실행/[01:00:54] my-box=boxplot(gross)객체할당

  • 0357분 연속형 데이터를 위한 그래프, 데이터의 요약통계, 일변량 데이터상자그림/히스토그램/커널밀도추정그림/데이터 중심에 대한 요약통계/데이터 퍼짐에 대한 요약통계/일변량 데이터와 관련된 통계적 추론/모평균에 대한 검정 및 신뢰구간 추정/모비율에 대한 검정 및 신뢰구간 추정/정규성 검정, 분포중심에 대한 비모수 검정

    책갈피 : [00:04] My_box 변수의 할당량 출력/[00:22] 예제코드 실행/[00:28] 개체안에 들어있는 name/[00:43] 구성 리스트/[00:57] Stats/[01:26] Out/[01:51] %in% 연산자/[02:14] %in% 연산자 기능/[02:49] 예제코드 실행/[02:58] %in% 결과를 대괄호 안에 입력/[03:16] 예제2번/[03:43] 예제코드 실행/[03:58] 히스토그램/[04:11] 히스토그램 작성방법/[04:39] Hist함수/[04:45] Hist함수 사용방법/[05:12] 각 구간을 나누는 점들로 이루어진 벡터/[05:20] 각 구간의 개수를 표시하는 하나의 숫자/[05:33] 각 구간의 개수를 계산하는 알고리즘을 칭하는 문자열/[05:54] 기본예제코드 실행/[06:12] 구간을 바꾼 예제코드 실행/[06:38] Freq 옵션/[06:59] Probability 옵션/[07:13] Freq 옵션과 Probability 옵션 비교예제/[07:40] 예제코드 실행/[08:19] 줄기-잎 그림의 한계/[08:24] 상자그림의 한계/[08:50] 히스토그램의 한계/[09:02] 커널밀도추정그림/[09:33] Density 함수/[09:44] Faithful 데이터/[09:50] Faithful 데이터 확인/[10:28] Density 함수결과 fit개체에 할당/[10:37] 예제코드 실행/[11:23] 기본 plot함수 실행/[11:33] 예제코드 실행결과 확인/[11:52] polygon함수에 col옵션 추가/[12:35] Rug함수/[12:46] 예제코드 실행/[13:33] Jitter 함수/[14:06] 히스토그램에 커널밀도추정그림 겹쳐그리기/[14:51] Hist함수를 확률밀도로 표현/[15:06] Rug함수/[15:14] Ddensity함수/[15:27] 예제코드 실행/[15:42] 상자그림의 한계를 완화/[15:54] Violin plot/[16:01] Vioplot 패키지 설치/[16:18] 예제코드 실행/[17:14] Horizontal 옵션 결과 설명/[18:01] 일변량 데이터의 요약통계/[18:34] 데이터 중심에 대한 요약통계/[18:53] Mean, Median 함수/[19:02] Faithful의 변수 waiting/[19:14] 연속형데이터에서의 최빈값/[19:33] 최빈값 계산법/[20:09] 예제코드 실행/[20:38] 데이터에 결측값이 포함되어 있는 경우/[20:54] Airquality변수인 Ozone/[21:04] 예제코드 실행/[21:35] Na.rm 옵션/[21:56] 예제코드 실행/[22:15] Rm(remove)/[22:33] 치우친 분포의 그래프 및 요약통계량/[23:31] Cfb데이터 확인/[23:56] Income 평균값과 중앙값의 차이/[23:59] 예제코드 실행/[24:20] 실행결과를 Hist과 커널추정그림으로 확인/[24:34] 예제코드 실행/[25:06] Log변환시 주의사항/[25:24] 예제코드 실행/[26:10] 실행결과를 Hist과 커널추정그림으로 확인/[27:21] 데이터 퍼짐에 대한 요약통계/[27:42] 범위(range)/[28:00] 예제코드 실행/[28:22] 사분위범위(Interquartile range)/[28:38] Quantile 함수/[28:54] 예제코드 실행/[29:16] IQR함수/[29:34] 예제코드 실행/[29:53] 표준편차(Standrd deviation), 분산(Variance)/[30:31] Var, sd함수/[30:42] 예제코드 실행/[31:03] 일변량 데이터와 관련된 통계적 추론/[31:18] 단일 모집단의 모평균에 대한 검정 및 신뢰구간 추정/[31:49] T-test함수/[31:46] Alternative 함수/[32:29] 예제문제 실습/[33:15] t.test(x, alternative="less",mu=17)/[33:41] 주어진가설에 대한 t.test함수/[33:43] 예제코드 실행/[34:27] 95% 신뢰구간 계산/[34:46] Alternative옵션이 two.sided로 변경/[35:14] 수행결과를 res1에 할당/[35:24] 예제코드 실행/[35:46] T.test(x)$conf.int/[35:53] 예제코드 실행/[36:09] 단일 모집단의 모평균에 대한 검정 및 신뢰구간 추정/[37:02] 패키지 usingR 불러내기/[37:12] 예제코드 실행/[37:51] 단일 모집단의 모비율에 대한 검정 및 신뢰구간 추정/[38:36] Prob.test 함수/[38:52] 옵션 alternative/[39:02] 옵션 conf.lever/[39:42] X에 성공횟수를 지정하는 방법/[39:49] x=성공횟수/[40:07] Tavle()작성된 도수분포표 입력(성공횟수, 실패횟수)/[40:20] 1x2 행렬(성공횟수, 실패횟수)/[40:50] 모비율의 추정량인 X/n이 정규분포를 따르지 않는경우/[41:22] 기본 사용방법/[41:58] 예제/[43:16] Prop.test/[43:48] 예제코드 실행/[44:48] Alternative를 greate로 변경(Alternative를 to.sidede로 변경)/[44:57] 예제코드 실행/[45:15] 예제/[46:04] 95%신뢰구간 코드/[46:20] 패키지 usingR 불러오기/[46:37] 예제코드 실행/[46:58] 예제/[47:48] 예제코드 실행/[48:05] 경고메세지/[48:12] Binom.test/[48:58] 정규성 검정/[49:37] Shapiro.test() 함수/[50:17] 예제/[50:33] 예제코드 실행/[51:50] 히스토그램, 커널밀도추정그림/[52:10] 분위수-분위수 그래프/[52:33] 예제그래프/[53:07] 분위수-분위스 그림(Q-Q plot)/[53:42] 예제코드 실행/[54:42] 예제/[54:44] 예제코드실행/[55:06] Shapiro.test(log(price))/[55:28] 단일 모집단의 분포중심에 대한 비모수 검정/[56:26] Wilcoxon signed rank

  • 041시간 1분 이변량 범주형 데이터도수분포표 작성/이변량 범주형 데이터를 위한 그래프/상자그림, 커널밀도추정 그림, 평균 막대그림, 연속형 변수의 분포 비교를 위한 요약통계/산점도 작성/상관계수 계산

    책갈피 : [00:13] Wilcox.test 사용방법/[00:31] 비모수 vs t-검정/[00:46] 그래프확인/[01:26] Log로 변환된 income/[01:48] 변수 Income/[02:29] 예제코드 실행/[02:39] P-value값/[02:52] 그래프확인/[03:04] Log변환된 income에 대괄호 적용/[03:16] 예제코드 실행/[04:35] 이변량 데이터의 정리/[05:21] 이변량 범주형 데이터의 정리/[05:31] 분할표 작성/[05:51] 데이터 Arthritis 이용예제/[06:14] 데이터 Arthritis 내용보기/[07:06] 1차원 도수분포표 작성/[07:17] 예제코드 실행/[08:00] 1차원 상대도수분포표 작성/[08:07] 예제코드 실행/[08:38] options로 소수점 자리수 조절/[09:09] 예제코드 실행/[09:36] 2차원 도수분포표 작성/[10:05] 예제코드 실행/[10:24] 2차원 분할표의 한계분포(marginal distribution)작성/[10:41] 행.열 합계구하기/[10:52] Margin.table 함수/[11:12] 예제코드 실행/[11:50] Addmargins 함수/[11:59] 예제코드 실행/[13:00] 2차원 상대도수분할표(결합분포표) 작성/[13:17] 예제코드 실행/[15:19] Table() 유용한 정보/[15:30] Airqualty $Ozone 데이터 보기/[16:18] UseNA="ifany" 옵션/[16:23] 예제코드 실행/[16:36] SAS(proc freo) or spss(crosstabs) 출력/[16:53] Crosstable함수/[17:03] 예제코드 실행/[17:20] Format="spss"옵션/[17:36] 예제코드 실행/[17:45] Expected, chisq 옵션/[18:04] 예제코드 실행/[18:25] 이변량 범주형 데이터를 위한 그래프/[19:08] 안전벨트 이용 데이터이용/[19:17] 데이터내용보기/[19:37] 쌓아올린 막대그림(barplat)/[19:44] 예제코드 실행/[20:46] 막대그림에 legend옵션 추가/[21:06] 예제코드 실행/[21:30] 옆으로 붙여 놓은 막대그림 작성/[21:35] Beside=t 옵션사용/[21:39] 예제코드 실행/[21:50] Spine plot/[22:09] Spine 함수/[22:20] 예제코드 실행/[23:08] 선에 종류와 색깔 조절/[23:17] Gpar 옵션사용/[23:41] Mosaic plot/[24:22] 예제코드 실행/[25:09] Mosaic 함수/[25:37] 예제코드 실행/[26:07] Direction=h로 지정/[26:14] 예제코드 실행/[26:45] 이변량 연속형 데이터의 정리/[27:40] 정규분포 t분포, 균등분포 난수발생시킨 결과사용/[28:11] 나란히 서 있는 상자그림/[28:25] 예제코드 실행/[29:09] 실습에 사용할 데이터내용/[29:33] Boxplot(mpg~cy`, data=mtcars)/[29:49] 예제코드 실행/[30:12] Plot함수 사용/[30:31] 예제코드 실행/[30:56] 겹쳐 그린 커널밀도추정그림/[31:35] Cyl 갯수에 따른 연비에분포를 생성/[31:54] 예제코드 실행/[32:34] 그래프상에 모든값이 나타나지 않는경우/[32:46] 위치조정/[32:52] 예제코드 실행/[33:31] Sm.density.compare(x,group,...)함수사용/[33:55] 예제코드 실행/[34:10] Cyl종류에 따른 mpg값을 평균막대그림으로 생성/[34:42] Aggregate 함수/[35:05] Tapply 함수/[35:21] 예제코드 실행/[36:45] 평균막대그림-barplot+신뢰구간 표시/[36:59] barplot2함수 사용/[38:20] 예제코드 실행/[38:35] 연속형 변수를 병렬적 분포 비교에 유용한 함수/[38:50] Summary() 함수/[38:59] 예제코드 실행/[39:09] Describe()함수/[39:22] 예제코드 실행/[39:42] Stat.desc 함수/[41:13] 예제코드 실행/[41:38] Round 함수 사용/[41:42] 예제코드 실행/[42:28] Describe 함수/[44:18] 예제코드 실행/[44:24] 경고문구 확인/[45:12] Hmisc::describe(mtcars)/[45:24] 예제코드 실행/[45:36] 연속형 변수들의 그룹별 분표 비교애 유용한 함수/[45:49] Aggregate 함수/[46:23] 예제코드 실행/[46:39] Summaryby 함수/[47:09] 예제코드 실행/[47:22] 두 연속형 변수들의 관계를 나타내는 그래프 및 요약통계/[48:49] 산점도(plot)/[49:47] Plot(x,y=null,type="p",axes=t...)/[50:42] Abline함수/[51:08] Loess.smooth 함수/[51:20] 예제코드 실행/[51:36] plot함수를 이용한 산점도코드를 실행/[51:59] 상관계수(cor)/[53:38] 예제코드 실행/[53:53] 상관계수를 구하는 코드를 실행/[54:19] 오류발생확인/[54:47] pairwise.complete.obs/[55:08] Method 옵션/[56:41] 통계적추론을 할수있는 R 함수사용법/[57:24] 두 범주형 변수의 독립성 검정/[57:51] 카이제곱 독립성 검정/[58:00] Chisq.test(x,y=null, simulate.p.value=f)/[59:21] Monte carlo 모의실험

  • 0557분 이변량 데이터와 관련된 통계적 추론, 회귀분석카이제곱 독립성 검정/Fisher의 정확검정/두 모집단의 모비율 차이에 대한 검정/신뢰구간 추정/두 모집단의 모평균 차이에 대한 검정 및 신뢰구간 추정/두 모집단의 중심차이에 대한 비모수 검정/회귀분석/단순선형회귀모형/다중선형회귀모향

    책갈피 : [00:07] 카이제곱 독립성 검저/[00:13] 예제코드 실행/[00:57] 패키지 vcd 데이터/[01:21] 카이제곱 검정 실행/[01:32] 결과값 설명/[02:23] Assocstats/[02:43] 연관성 측도 관련된 통계량/[02:45] 예제코드 실행/[03:24] Fisher의 정확 검정/[04:09] Simulat 옵션/[04:31] 기타옵션 설명/[04:41] 2X2 분할표/[04:56] 오즈(odds)/[05:49] 오즈비(odds ratio, OR)/[06:30] 오즈비 2X2분할표 예/[08:05] Fisher의 정확검정/[08:20] 옵션 or/[08:31] 옵션 alternative/[08:48] 옵션 conf.int/[09:01] 옵션 conf.level/[09:11] 실습에서 사용할 teataste 내용 확인/[09:18] 2x2분할표/[10:21] 귀무가설 or=1/[10:40] 대립가설 or>1/[11:28] 설정후 fisher.test/[11:33] 예제코드 실행/[12:05] 직업 만족도 데이터/[12:23] 카이제곱 검정과 Fisher 검정 결과/[13:08] 카이제곱 검정 예제코드 실행/[13:38] Simulate.p.value=true값 적용/[13:41] 예제코드 실행/[14:21] Fisher 정확검정 예제코드 실행/[15:06] Simulate.p.value=true값 적용/[15:32] 예제코드 실행/[15:58] Systerm.time R함수 이용/[16:02] 예제코드 실행/[16:17] 카이제곱 Fisher 결과값 시간비교/[16:56] 두 모집단의 모비율 차이에 대한 검정 및 신뢰구간 추정/[17:45] Prop.test/[18:40] x값, n값 입력/[19:14] 옵션 alternative/[19:50] "less","greater"/[20:59] 귀무가설(ho), 대립가설(h1) 설정/[21:11] 예제코드 실행/[21:26] 함수 prop.test(x=x, n=n)/[22:07] prop.text(x=x12)$p.value/[22:10] 예제코드 실행/[22:48] 두 모집단의 모평균 차이에 대한 검정 및 신뢰구간 추정/[23:04] 독립된 두 표본에 대한 추론/[23:24] 짝을 이룬 표본에 대한 추론/[23:53] 독립된 두 표본에 대한 추론 예제/[23:57] T.test/[24:14] 옵션 Alternative 설정/[24:24] 옵션 var.equal 설정/[25:19] 옵션 conf.level 설정/[25:59] 귀무가설 검정/[26:09] 예제코드 실행/[26:52] Mtcars 데이터 이용/[27:07] Mtcars 데이터 내용 확인/[28:01] T.test 로 변수 지정/[28:04] 예제코드 실행/[29:26] Boxplot을 이용한 분포 비교/[29:25] 예제코드 실행/[30:13] 두 모집단의 분산 동일성에 대한 f-검정/[30:27] var.test 함수 이용/[30:43] 귀무가설 = 분산1/분산2=1/[31:22] 예제코드 실행/[32:32] var.equal 함수사용하지 않을경우/[32:46] 짝을 이룬 표본에 대한 추론 예제/[33:03] T.test/[33:06] Paired=t/[33:30] Mass에 shoes 데이터 확인/[34:52] t.test(a,b, paired=T) 모평균 검정 실행/[34:57] 모평균 검정 실행결과 확인/[35:58] 두 모집단의 중심차이에 대한 비모수 검정/[36:08] Wilcoxon rank sum 검정/[36:12] Wicoxon singed rank 검정/[36:31] Wilcox,test 함수 사용/[37:13] 귀무가설 mu=0/[37:18] 옵션 pairde=f/[37:52] 균등분포에서 10개 랜덤추출/[38:19] 예제코드 실행/[38:44] 변수 mpg, am/[39:08] 예제코드 실행/[39:37] Alternative="less"/[40:01] 경고문구 출력/[40:26] shoes$A, shoes$B, paired=t/[40:41] 예제코드 실행/[40:54] 경고문구 출력/[41:24] 회귀분석/[42:00] 단순선형회귀모형/[42:21] 종속변수, 독립변수/[42:41] 오차항 확인/[42:50] 데이터프레임 women이용/[43:24] plot(weight~height, data=women) 두변수 비교/[43:29] 예제코드 실행/[43:56] 함수 lm(linear model)/[43:59] 예제코드 실행/[44:50] 함수 lm 주요인자/[45:25] names(fit) 내용 확인/[45:54] 회귀분석 결과의 획득에 유용하게 사용되는 함수/[46:20] 패키지 car이용/[46:48] 예제코드 실행/[47:17] 다중선형회귀모형/[47:24] 종속변수, 독립변수/[47:44] 오차항 확인/[48:23] 회귀모형의 적합/[48:43] 함수 lm 사용방법/[48:48] 옵션 data/[48:59] 옵션 subset/[49:18] Subeset이용 예제/[49:58] 옵션 weights/[50:28] R공식에서 사용되는 기호/[50:41] 다중선형회귀모형/[50:45] State.x77 데이터 내용 확인/[51:35] State.x77 데이터 타입 data.frame/[52:56] Plot(states)/[53:00] 예제코드 실행/[54:11] Scatterplotmatrix함수/[54:26] 예제코드 실행/[55:14] Pairs(states)/[55:21] 예제코드 실행/[55:44] Pairs 개념, 사용예제 확인/[56:06] Pairs 예제 결과확인/[56:31] 기존예제에 pairs예제를 조합/[56:46] 예제코드 실행/[56:59] 종속변수 murder과 독립변수 지정/[57:09] 예제코드 실행

  • 0656분 다중선형회귀모형회귀모형의 추론/회귀모형의 anova표 사용/회귀진단 및 대안탐색/회귀모형의 가정 만족여부 확인/동일분산 가정 확인/정규분포가정 확인/독립성 가정 확인/선형관계 확인/다중공선성 확인에 특이한 관찰값 탐자

    책갈피 : [00:07] 다중선형회귀모형/[00:42] # summary/[01:08] Residuals/[01:36] Coefficients/[02:51] Signif. codes/[03:00] Multiple R-squared/[04:05] F-statistic/[04:41] anova/[05:14] 분산분석기법/[05:25] 효과에 따른 변동, 오차 변동/[05:54] F ratio/[07:05] anova를 적용한 회귀결과/[09:13] anova표 살펴보기/[10:05] fit, fit2/[11:06] illiteracy/[11:35] 귀무가설을 기각하기 못하는 예/[11:57] fit3과 fit1의 비교/[12:31] frost/[12:46] # predict/[13:01] object/[13:13] newdata/[13:26] interval/[13:58] Population/[14:14] Murder/[14:29] 결과 보기/[15:20] data=women/[16:22] n차 다항회귀 모형 설정/[16:28] poly, I/[17:06] poly함수의 일반적 사용방법/[18:06] raw=T/[18:22] weight, height/[18:34] 결과 보기/[18:51] 1차 단순회귀모형, 2차 다항회귀모형/[19:06] 회귀분석/[19:55] 회귀모형의 가정 만족여부 확인/[20:19] plot/[20:55] par/[21:28] which/[21:54] 단순선형회귀모형/[23:00] 네가지 회귀모형의 가정/[24:11] 오차항의 동일분산 가정/[24:58] ncvTest/[26:01] 오차항의 정규분포 가정/[26:36] 로버스트 선형회귀/[26:56] shapiro.test/[27:01] 결과 확인/[27:52] 오차항의 독립성 가정/[28:39] durbinWatsonTest/[28:55] 1차 자기상관 관계/[29:38] length/[30:52] expression/[31:08] 결과 확인/[32:14] p-value/[32:56] women 데이터프레임 살펴보기/[33:46] 선형관계/[35:00] 독립변수, 종속변수/[35:20] crPlots/[35:29] 부분잔차 산점도 작성/[37:21] 다중 공선성/[38:32] 분산팽창계수/[39:12] 결과 확인/[40:51] 특이한 관찰값 탐지/[41:31] influence.measures/[42:20] inf/[43:03] 미50개주 데이터 출력/[44:17] 그래프 작성/[45:08] hat/[45:42] Leverage/[45:48] abline/[46:41] 코드 수행/[47:11] identify/[48:20] labels/[49:23] identify종료/[50:13] Cook's Distance/[51:25] influence.measures/[51:52] avPlots/[54:06] id.method/[54:23] 코드 수행

  • 0755분 대안 탐색종속변수의 변환/독립변수의 변환/변수의 선택/검정에 의한 방법/모형선택 기준에 의한 방법/최근접 이웃을 사용한 분류/정의, KNN알고리즘

    책갈피 : [00:10] 잔차/[00:36] 스튜던트화 잔차/[00:54] p밸류 계산/[01:37] 세가지 통계값에 대한 그래프/[02:02] 코드 수행 결과/[02:40] 알래스카 주의 경우/[03:05] 네바다주의 경우/[03:54] 자유도, t분포/[04:48] outlierTest/[05:06] 코드 수행/[05:55] Bonferonni p밸류/[06:51] 대안 탐색/[07:26] 종속변수 독립변수의 관계/[08:00] 변환 R함수 살펴보기/[08:15] Box-Cox변환/[09:21] 코드 살펴보기/[09:28] 람다값/[09:43] 코드수행 결과/[11:20] 반응변수 변환시 주의점/[12:38] powerTransform 함수 적용 결과/[13:51] 종속변수의 로그변환/[14:34] 독립변수의 변환방법/[15:00] boxTidwell/[16:01] 함수적용결과/[16:35] 오류발생 요소 제거/[17:25] women을 이용 boxTidwell 함수 수행/[18:14] R공식에서 사용되는 기호/[18:24] 다항회귀모형 설정 결과/[18:37] summary함수를 이용한 결과값/[20:09] 모델의 선형성 확인/[20:41] 변수선택에 대해 살펴보기/[21:08] 변수선택의 두가지 방법/[21:24] 검정에 의한 방법/[22:13] 검정방법의 단점/[23:05] addterm, dropterm/[23:28] state.x77을 이용해서 살펴보기/[23:39] data.frame 형태/[25:20] 전진선택법/[26:44] 코드수행을 통한 변수영향력 알아보기/[28:04] fit=update/[28:32] 기호.물결./[29:03] 코드수행 결과/[29:36] addterm에 변수 적용/[29:55] population, Area, illiteracy/[31:03] 후진소거법/[32:41] dropterm함수 수행결과/[34:01] 변수를 제거한 수행결과/[34:34] 유의 수준/[35:16] 전진선택법의 추가검정/[36:06] 단계별 선택법/[36:22] 후진소거법/[36:50] 모형선택 기준에 의한 방법/[37:06] 통계량의 종류/[37:53] 모든 가능한 회귀방법/[38:56] 빅데이터/[39:19] AIC, BIC/[39:36] regsubsets/[40:05] 수행 결과 확인/[41:12] 모형의 최적기준/[41:38] names(cri.fits)/[41:54] rsq. rss/[42:09] adjr2, cp, bic, outmat/[42:33] 수정결정개수와 cp통계량을 이용한 모형선택/[43:29] 코드수행 결과/[44:51] 회귀개수가 다섯개인 모형/[45:08] 회귀개수가 여섯개인 모형/[45:42] AIC를 이용한 단계별 변수선택법/[46:45] 코드수행 결과/[48:39] both/[49:45] step을 이용한 결과/[50:48] 기계학습/[51:18] 기계학습의 세분화/[51:29] 기계학습 알고리즘/[51:46] 기계학습 내용시 참조할 웹페이지 주소/[51:56] 최근접 이웃을 사용한 분류/[53:00] 최근접이웃 분류기의 정의/[53:37] KNN알고리즘

  • 0854분 최근접 이웃을 사용한 분류KNN알고리즘을 활용한 유방암 진단/나이브 베이즈를 사용한 분류/베이즈 이론/SMS 메세지 필터

    책갈피 : [00:12] dist 함수/[00:24] 유클리드 거리방법/[00:57] 유클리드거리& 맨하튼거리/[01:58] 테스트 데이터, 훈련데이터/[02:18] TEST데이터의 범주 분류/[02:35] 1NN분류/[02:45] k=3/[03:44] 미래의 데이터 일반화 결정/[04:03] k의 설정/[05:45] 실습의 단계/[05:50] uci기계학습 저장소 사이트/[06:06] Breast Cancer Wisconsin/[06:17] 기부 데이터 다운로드/[06:26] wdbc.data/[06:36] wdbc.names/[06:50] 유방암덩어리에 대한 측정값/[08:03] 실습데이터 보기/[08:28] read.table/[08:44] stringsAsFactors/[09:22] 코드수행 결과/[10:15] id, diagnosis/[10:27] knn알고리즘 적용을 위한 데이터 다듬기/[10:44] 코드수행 결과/[11:19] labels옵션/[11:51] summary/[13:08] 수치데이터의 정규화 사용자함수 만들기/[13:39] 코드 수행 결과/[13:49] 간단한 백터로 함수 수행/[14:20] 사용자 정의 함수 적용/[14:37] lapply/[15:21] summary함수로 결과값 보기/[15:45] 훈련과 테스트 데이터 만들기/[16:54] 코드 수행/[16:57] 훈련셋과 테스트셋을 만들 때의 주의점/[17:41] sample함수/[18:13] knn알고리즘/[19:11] 훈련데이터수의 제곱근/[19:47] Euclidean distance/[20:08] 모델 성능 평가/[20:20] CrossTable/[20:37] prop.chisq/[21:04] 양성, 악성의 결과값들 확인/[21:43] Cell Contents/[23:46] 정규화 방법 변환/[24:22] scalse함수 적용 결과보기/[25:26] 교차표 결과값/[26:17] for/[26:36] CrossTable함수의 수행 결과/[27:17] res$t/[27:45] Results1/[28:54] 결과값 확인/[30:24] 나이브 베이즈를 사용한 분류/[31:07] 베이즈 이론/[31:26] 예제를 통한 살펴보기/[31:59] 사전확률/[32:23] 사후확률/[32:49] Viagra/[33:11] 주변우도/[33:22] 우도/[35:11] 나이브베이즈 알고리즘/[35:40] 나이브베이즈 알고리즘의 단점/[36:03] 나이브베이즈 알고리즘의 장점/[36:36] SMS Spam Collection/[36:54] 다운로드 경로/[37:09] 파일내용 살펴보기/[37:47] 변경한 데이터/[38:20] sms_raw/[38:54] Sys.setlocale/[39:53] Korean_korea/[40:40] 결과값 확인/[41:44] factor/[42:15] 텍스트 처리에 필요한 방법/[43:00] library(tm)/[43:25] sms_corpus/[43:52] corpus함수 적용결과 수행/[45:13] 예시/[45:30] tm_map/[45:45] content_transformer/[46:41] removeNumbers/[47:18] removeWords, stopwords/[48:36] removePunctuation/[49:04] stripWhitespace/[49:38] DocumentTermMatrix/[51:05] 빈도매트릭스에서의 표현/[51:58] 데이터 준비와 탐구/[53:21] 결과 확인

  • 0957분 결정트리와 규칙을 사용한 분류결정트리의 이해/결정트리의 활용 예시/결정 트리의 가지치기/C5.0결정 알고리즘/결정트리를 이용한 은행 대출관리

    책갈피 : [00:02] 단어 클라우드/[00:22] wordcloud패키지/[01:08] random.order/[01:41] 수행결과 확인/[01:59] subset/[02:46] scale변수/[03:02] 수행결과 확인/[04:08] 데이터를 적용해 모델 훈련/[05:27] findFreqTerms/[06:21] convert_counts/[08:09] naiveBayes함수/[08:24] 수행결과 확인/[08:44] 나이브베이즈 알고리즘 적용/[09:09] e1071패키지/[09:19] naiveBayes함수의 사용방법/[09:51] laplace추정기/[10:26] 코드 수행 결과값/[12:05] predict로 테스트메세지의 범주 예측/[12:58] 수행결과 확인/[13:52] 예측값과 실제범주 비교/[14:18] prop.t/[14:35] dnn/[14:45] 교차표 생성/[15:43] 모델성능향상 방법/[16:17] 결과 살펴보기/[17:05] 나이브베이즈 알고리즘 정리/[18:02] 결정트리 분류/[18:45] 결정트리의 이해/[19:25] 루트 노드, 결정 노드, 잎 노드/[20:15] 활용되는 분야/[21:18] 결정트리 가지치기/[21:38] 예시를 통한 살펴보기/[24:04] 결정트리 가지치기의 경우/[25:09] 결정트리의 속성구분 특징/[26:53] C5.0 알고리즘을 통한 실습/[27:32] C5.0 알고리즘의 특성/[27:53] 속성의 선택/[28:27] Entropy를 계산하는 방법/[29:33] Entropy 예시/[31:24] 결정트리 가지치기의 원리/[32:15] C5.0알고리즘의 장단점/[32:36] 사후 가지치기/[33:08] 위험대출 신청자 예제/[33:28] UCI기계학습 저장소/[33:41] view all data sets/[33:50] German Credit Data/[34:50] credit.csv/[35:06] 실습데이터 저장방법/[35:31] read.csv/[35:40] str함수로 데이터구조 살펴보기/[37:04] 체킹계좌, 세이빙계좌/[37:41] 대출기간, 대출총액/[38:19] 훈련데이터, 테스트데이터/[39:47] set.seed/[40:41] runif/[41:04] 데이터 분류 코드 수행/[42:07] C50패키지/[43:35] factor속성/[44:05] 결과값 확인/[44:48] summary함수로 트리내용 살펴보기/[47:40] 훈련데이터상 잘못된분류 교차표/[48:44] credit_pred/[49:14] 코드수행 결과/[50:18] Boosting/[51:19] C5.0함수의 부스팅/[51:46] 코드수행 결과/[52:29] summary함수를 적용한 살펴보기/[53:04] credit_boost_pred10/[54:28] error_cost/[54:44] matrix내용 살펴보기/[55:49] 패널티를 적용한 모델 결과

  • 1054분 규칙학습자 & 회귀기법규칙 학습자의 이해, 독버섯 식별을 위한 실습/회귀 이해, 선형 회귀를 사용한 의료비 예측 실습

    책갈피 : [00:02] 규칙학습자/[00:14] 규칙학습자의 활용예시/[00:34] 규칙학습자와 결정트리의 차이/[01:59] 결정트리로부터의 규칙학습자/[02:44] 동물집단 예시/[03:42] 트리의 규칙으로 살펴보기/[04:34] C5.0함수/[05:03] 수행 결과 확인/[06:21] 규칙학습자 알고리즘 적용 수행 결과/[07:27] 규칙학습기를 이용한 독버섯 식별하기 예제/[07:47] UCI기계학습저장소의 버섯데이터 셋/[08:22] 항목설명/[08:57] mushrooms.csv/[09:19] raw데이터 저장/[09:52] read.csv/[10:04] 명목형 척도/[10:44] 구조 살펴보기/[11:53] NULL제거/[12:16] 범주정보 살펴보기/[12:42] poisonous, edible/[13:02] OneR/[13:59] 틸트 연산자/[14:31] 닷의 사용/[14:40] ?formula/[14:57] 훈련셋과 테스트셋/[15:28] 수행결과 확인/[16:02] 용어설명/[17:04] summary함수를 분류기에 적용/[18:25] mushroom_classififier/[18:55] mushroom_prediction/[19:27] 결과값 확인/[19:57] 추가적인 함수 살펴보기/[20:08] JRip/[20:41] 수행결과 확인/[20:55] foul/[22:18] summary함수를 분류기에 적용/[23:00] 나누어 정복하기, 구분해 정복하기/[23:22] 선형 회귀,트리, 모델 살펴보기/[23:36] 회귀분석/[24:08] 활용 예시/[24:47] 단순 선형 회귀/[25:09] 다중 회귀/[25:19] 로지스틱 회귀/[25:33] 포아송 회귀/[25:56] 미국의 환자의료비를 포함한 가상데이터셋/[26:25] 보험회사/[27:46] insurance.csv 구조 확인/[28:37] age/[29:00] sex, bmi/[29:28] children, smoker/[29:46] region/[31:00] 차지의 분포 살펴보기/[32:33] table(insurance$region)/[33:10] cor/[34:52] pairs/[35:50] pairs.panels/[36:41] 추가적인 시각정보/[38:53] 로이스 곡선/[39:22] 데이터로 모델 훈련/[39:55] 수행 결과 살펴보기/[42:14] 더미 코딩/[42:39] sex변수/[42:59] region변수/[45:50] summary로 결과값 살펴보기/[46:40] 0.05레벨/[48:10] 모델 성능 향상/[49:52] age2/[50:16] bmi항목/[52:47] 결과값 확인

  • 1158분 수치 데이터의 예측 회귀기법 & 인공 신경망 알고리즘인공 신경망 알고리즘의 이해, 인공신경망 알고리즘을 이용한 콘크리트의 내구력 모델 학습/인공 신경망 알고리즘의 이해, 인공신경망 알고리즘을 이용한 콘크리트의 내구력 모델 학습

    책갈피 : [00:02] 수치예측 트리 알고리즘 살펴보기/[00:19] 회귀 트리/[01:09] 모델 트리/[02:23] 회귀트리와 모델트리의 이해/[04:17] 수치예측용 트리/[04:44] 결정트리 방법/[04:54] 수치결정 트리에서의 균일성/[05:06] 표준편차리덕션/[06:45] SDR/[08:34] 화이트와인 데이터 예시/[08:53] whitewines.csv 구조 살펴보기/[09:43] 회귀 트리 모형/[10:34] hist로 살펴보기/[11:10] wine_train, wine_test 수행 결과/[11:50] rpart패키지/[12:15] ?rpart.control/[12:40] rpart함수 수행 결과/[14:11] rpart.plot/[14:23] 코드수행 결과/[14:40] 디지트 파라미터/[14:53] fallen.leaves=T/[15:11] type옵션/[15:28] ?rpart.plot/[15:49] extra옵션 조정/[16:04] prdict를 사용한 수행 결과 확인/[18:24] 평균 절대 오차값 계산하기/[19:56] 성능향상을 위한 모델트리 만들기/[20:40] 수행 결과 확인/[22:11] 데이터등급 예측결과 살펴보기/[23:11] 인공신경망 알고리즘/[23:46] 인풋, 아웃풋 신호/[23:58] 생물학적 뉴런/[24:30] 인공 뉴런/[26:15] 휴리스틱/[27:33] 인공 두뇌/[28:31] 인공신경망 활용 예시/[29:52] 블랙박스 기법/[31:23] 인공뉴런 모델 살펴보기/[33:09] 네트워크 토플로지/[33:21] 활성함수/[33:34] 임계활성함수/[34:45] 로지스틱 시그모이드 함수/[35:40] 다양한 활성함수 살펴보기/[35:52] neuralnet/[36:51] 쌍곡선탄젠트 함수/[37:55] 스쿼싱함수/[38:57] normalize/[39:30] 네트워크 토플로지/[39:52] 노드, 링크/[40:28] 층/[41:06] 인공신경망 네트워크 예시 그림/[42:30] 은닉층/[43:12] 멀티플 히든레이어/[43:20] 정보진행 방향/[43:49] 전방향 네트워크/[43:59] 재귀 네트워크/[45:48] neuralnet의 옵션/[47:09] 과적합/[48:31] 가중치 학습 알고리즘/[49:42] 오차 역전파 알고리즘/[51:04] 인공신경망 알고리즘의 장단점/[52:15] 콘크리트 압축 내구력 예시/[52:40] concreate.csv함수 구조 살펴보기/[53:23] 속성 데이터의 분포 살피기/[54:15] lapply를 사용한 코드 수행/[55:11] normalize

  • 1258분 인공신경망 알고리즘 & 서포트 벡터 머신콘크리트의 내구력 모델의 실습/서포트 벡터 머신의 원리, 광학식 문자 인식 실습

    책갈피 : [00:02] concrete_norm/[00:50] train, test/[01:12] 콘크리트 내구력 모델화/[01:28] multilayer feedforward neural network/[02:04] RSNNS패키지/[02:58] 속성 공식/[03:46] concrete_model 수행/[04:09] plot 적용 피드포워드 신경망 생성/[05:14] 바이어스 텀/[06:31] compute함수/[07:38] 코드 수행 결과/[08:23] predicted_strength/[09:21] 코드 수행 결과/[11:08] concrete_model2/[12:10] 코드 수행 결과/[12:50] 서포트 벡터 머신/[13:19] 서포트 벡터 머신의 이해/[13:43] 초평면/[14:37] 선형 분리/[15:35] 의사결정의 경계/[16:38] 최대 마진 초평면/[16:49] 서포트 벡터/[17:46] 벡터 기하학/[18:00] 벡터기하학의 기본 원리/[18:15] 볼록 껍질/[18:40] 서포트벡터머신 활용분야/[19:15] 분류 작업 활용/[19:39] 이미지 처리/[20:25] 이미지데이터 문제 해결/[21:25] 광학식 문자 인식/[22:57] 손글씨 이미지 데이터/[23:02] UCI기계학습저장소 URL/[23:24] letterdata.scv구조/[24:41] 이미지 부가설명/[24:59] 서포트벡터머신 학습기의 처리속성/[26:19] ksvm함수/[26:38] 속성 데이터의 분포 살피기/[27:03] train, test 수행/[27:47] 서포트벡터머신 적용 선택패키지/[28:09] kernlab/[29:02] 커널정보/[29:28] 커널트릭/[29:47] 커널 함수의 형식/[30:06] 예제 살펴보기/[31:17] 커널의 의미/[31:36] 선형 커널/[31:50] 차수 다항 커널/[31:57] 시그모이드 커널/[32:22] 가우시안 RBF커널/[33:38] 선형 커널함수 사용/[33:55] ?ksvm 검색/[34:13] C옵션/[34:44] Cost Value/[36:24] 코드 수행 결과/[37:05] test데이터로 성능 살펴보기/[37:25] predict함수의 타입 옵션/[37:57] 코드 수행 결과/[38:24] 예측된 문자와 실제문자 비교/[39:17] agreement/[40:52] RBF커널 사용/[41:07] rbfdot 코드 수행 결과/[41:57] K평균을 이용한 군집화 머신러닝/[42:49] clustering/[43:55] 군집화의 활용예시/[45:08] 학회개체 예시/[46:38] 축 평행분할/[47:42] k평균 알고리즘/[51:56] k평균 알고리즘의 속성값/[52:57] k평균 알고리즘의 장단점/[54:06] 군집의 수/[55:32] k값의 설정/[56:09] 엘보우 기법

  • 1354분 K평균을 이용한 군집화 & 연관규칙K평균을 이용한 잠재 고객 분류 실습/연관규칙의 이해, 연관 규칙을 이용한 실습 데이터 학습

    책갈피 : [00:01] k평균을 이용한 잠재고객 분류실습/[01:16] 데이터 수집/[01:22] snsdata.csv 구조 살펴보기/[01:33] snsdata 설명/[01:57] 스트럭쳐 함수 결과 살펴보기/[03:20] 데이터에 대한 모델 훈련/[03:47] kmeans함수/[05:50] as.data.frame/[06:44] 데이터의 그룹핑/[07:22] k값의 설정/[07:58] elbow point값 코드 수행/[09:15] plot 결과 확인/[10:31] iter.max파라미터/[11:20] kmeans함수로 생성한 객체 구조/[11:34] withinss/[11:46] tot.withinss/[12:00] betweenss/[12:10] size/[13:08] totss/[13:16] centers항목/[16:18] 클러스터 항목 살펴보기/[16:43] teens$cluster/[16:59] aggregate/[17:21] 코드 수행 결과/[17:45] 결측값과 잘못된 정보/[18:18] ifelse함수/[20:46] mean/[21:40] 결측값 확인/[22:07] ave함수/[22:23] ?ave/[22:36] ave예시/[24:22] mean함수/[24:54] FUN/[25:35] 코드 수행 결과/[26:27] 군집에 따른 남녀비율 차이 살펴보기/[27:09] table함수/[28:23] useNA/[29:03] aggregate/[30:09] friends~cluster/[31:03] 모델 평가 살펴보기/[34:09] 추가적인 더미 변수생성/[34:35] 코드 수행 결과/[35:36] 연관 규칙/[36:01] 장바구니 데이터 분석 식료품 규칙/[36:25] 연관성 규칙/[37:35] 연관 규칙 활용 예시/[38:22] 연관 규칙의 장단점/[39:21] 선물가게DB 살펴보기/[40:39] support, confidence/[40:56] 꽃->병문안카드 신뢰도계산/[42:23] 병문안카드->꽃 신뢰도 계산/[44:47] Apriori원리/[45:17] 예시/[48:20] apriori함수/[48:39] 식료품 구매 데이터/[48:52] 엑셀로 groceries.csv살펴보기/[50:05] read.transactions함수 결과값 살펴보기/[52:13] inspect함수

  • 1454분 연관규칙 & 모델 성능 평가연관 규칙을 이용한 실습 데이터/정확도와 오차율/카파통계/민감도/특이도/정밀도/ROC 커브

    책갈피 : [00:00] 통계값을 시각화하는 함수/[00:10] itemFreguencyPlot/[00:39] 서포트 옵션을 이용한 제한표현 결과/[01:15] 탑엔 옵션을 이용한 제한표현 결과/[01:43] image/[01:51] groceries객체 내용 살펴보기/[03:31] image함수를 통한 시각적 내용확인/[04:20] 거래내역 살펴보기/[06:11] sample을 이용한 랜덤효과/[07:06] 데이터로 모델을 훈련하는 코드 살펴보기/[07:14] apriori함수 실행방법/[07:58] 옵션이 없는 코드 수행결과/[08:51] 기본설정값을 낮춰보기/[09:58] 신뢰도값/[10:19] 예시/[12:37] groceryrules옵션을 사용한 코드수행결과/[13:45] 연관규칙의 이해/[14:31] lift값/[15:59] Inspect함수/[16:28] 규칙의 해설/[17:43] arules패키지/[18:11] sort/[18:35] 코드 수행 결과/[19:38] subset/[20:24] 코드 수행 결과/[22:18] %ain%/[22:52] %pin%/[23:32] %in%/[24:01] lhs/[24:43] groceryrules_df/[25:19] write/[25:38] csv파일을 엑셀로 열어보기/[25:55] 모델성능 평가 방법/[26:08] train, test/[27:17] 나이브 베이즈 실습 이용/[27:41] e1071패키지/[27:49] sms_classifier/[28:07] CrossTable/[28:24] 정확도와 오차율/[29:02] True Positive/[29:16] True Negative/[29:29] False Positive/[29:40] False Negative/[30:48] confusionMatrix/[31:35] 코드 수행 결과/[33:21] 카파 통계/[37:20] kappa/[38:14] kappa2/[38:59] 민감도, 특이도, 정밀도의 계산/[39:10] sensitivity/[39:48] specificity/[40:25] precision/[41:07] caret패키지/[41:52] 코드 수행 결과/[44:10] ROCR패키지/[44:22] 예제확인

  • 1558분 모델 성능 평가 & 데이터의 시각화(1)샘플링 방법/파라미터 조절/메타학습을 활용한 모델 성능 향상/ggplot 함수의 기본적인 사용 방법/산점도/선 그래프/막대 그래프

    책갈피 : [00:02] 모델성능 향상방법/[00:18] 샘플링 방법/[00:37] 홀드아웃 기법/[01:11] credit.csv구조 살펴보기/[01:38] runif/[02:25] order/[03:22] 홀드아웃 기법의 문제점/[04:34] 층화 무작위 홀드아웃 기법/[04:47] createDataPartition/[06:17] credit_train, credit_test/[06:42] 코드 수행 결과/[07:56] 반복 홀드아웃 기법/[08:03] 교차검정/[09:24] createFolds/[09:55] 그룹생성 결과/[10:47] test데이터를 만드는 방법/[11:04] folds, my_function lapply/[11:28] my_function/[12:04] kappa2/[12:28] cv_results/[13:49] 부트스트랩 샘플링/[14:48] 교차검증과 부트스트랩의 차이점/[16:03] 파라미터 조절/[16:22] KNN알고리즘/[17:40] 시행착오방법의 단점/[18:01] 캐럿패키지 정리표/[18:39] 자동조절기능/[19:04] 캐럿패키지의 모델생성과 탐색/[20:09] train함수의 사용방법/[20:27] 코드 수행 결과/[20:40] 입력된 데이터에 대한 간략한 정보/[20:59] 부트 스트랩핑 방법/[21:15] 경고출력 내용 살펴보기/[21:35] 복원추출/[23:37] predict/[24:01] train함수의 조건을 변경하여 수행/[24:42] trControl/[25:08] cv/[25:40] best/[26:19] oneSE/[26:30] tolerance/[27:32] expend.grid/[27:54] 코드 수행 결과/[28:40] 새로운 조건으로 코드수행/[30:58] 메타학습방법/[31:04] bagging방법/[31:54] ipred패키지/[32:45] 코드 수행 결과/[33:51] boosting방법/[34:13] bagging과 boosting의 차이점/[34:37] random forests방법/[35:11] randomForest함수/[35:41] ntree파라미터/[36:00] mtry파라미터/[36:50] 코드 수행 결과/[37:54] 기본파라미터값 정확도/[38:56] m_rf, m_c50 결과 비교/[40:01] R을 활용한 데이터의 시각화/[40:13] ggplot2, gcookbook/[41:02] 산점도 그리기/[41:55] mtcars 데이터프레임 내용 살펴보기/[42:58] + geom_point/[43:51] 산점도 비교 코드 수행 결과/[44:07] 선 그래프 그리기/[44:19] + geom_line/[44:41] 그래프 비교 수행 결과/[44:49] 막대 그래프 그리기/[45:02] + geom_bar/[45:10] stat="bin"/[46:02] 코드 수행 결과/[46:14] barplot/[47:40] 코드 수행 결과/[48:00] 히스토그램 그리기/[48:57] binwidth옵션/[49:33] breaks인자의 다양한 활용/[50:01] 히스토그램 그래프 비교/[50:36] hist함수의 breaks옵션 수정해서 살펴보기/[51:06] 박스 플롯 그리기/[51:40] 패키지 비교 결과/[52:07] interaction/[52:58] 함수곡선 그리기/[54:32] 막대 그래프 그리기/[55:26] BOD 데이터프레임 코드 수행 결과/[56:43] fill 파라미터

  • 1659분 데이터의 시각화(2)막대그래프의 모양 수정/누적 막대 그래프/비율 누적 막대 그래프/클리블랜드 점 그래프

    책갈피 : [00:00] 여러그룹의 막대그래프 그리기/[00:09] cabbage_exp 살펴보기/[01:01] x, y, fill/[01:37] identity, dodge/[01:59] dodge를 명시하지 않은 경우/[02:38] dodge를 명시한 수행 결과/[03:14] scale_fill_brewer/[03:36] display.brewer.all수행 결과/[04:13] 팔렛을 사용한 그룹정보 색 확인/[04:34] scale_fill_manual/[05:11] reorder를 사용한 x축 순서 재정렬하기/[05:27] uspopchange데이터 살펴보기/[06:28] rank/[06:49] change, rank(change)값을 비교하기/[07:55] upc객체를 사용한 그림 그리기/[09:16] reorder함수를 사용한 코드 수행 결과/[11:02] FUN=mean/[12:21] labs/[12:56] 음수와 양수막대 다르게 색상 입히기/[13:14] climate데이터 살펴보기/[13:54] stack, identity/[14:25] position옵션 유무에 따른 결과값/[15:36] 0을 기준으로 그래프 색상을 변경하는 방법/[16:25] 코드 수행 결과/[16:48] 그래프 색상을 메뉴얼하게 지정하는 방법/[18:04] 코드 수행 결과/[18:39] 막대의 너비와 간격 조절하기/[19:35] pg_mean데이터 살펴보기/[20:19] width정보를 다르게 한 비교/[21:40] position_dodge/[22:34] dodge와 width값 설정에 따른 비교/[25:18] 누적 막대그래프/[25:51] 옵션이 없는 상태의 수행 결과/[26:48] guides/[27:24] cabbage_sxp 코드 수행 결과/[27:58] 비율 누적 막대 그래프/[28:35] play패키지/[29:17] 코드 수행 결과/[30:35] ddply/[31:16] Date정보에 따른 결과/[33:00] percent_weight코드 수행 결과/[34:52] 막대그래프에 라벨 추가하기/[35:16] geom_text/[36:01] 코드 수행 결과/[37:18] 묶인 막대 그래프/[38:22] position_dodge/[39:37] ymax지정방식/[40:29] 코드 수행 결과/[40:49] geom_text/[41:36] 누적 막대 그래프/[42:58] ddply함수 이용/[43:55] 코드 수행 결과/[44:42] ce데이터 플랫/[45:44] y값을 재설정한 결과/[48:00] 클리블랜드 점 그래프 그리기/[48:37] geom_point/[48:48] tophitters2001 데이터 살펴보기/[49:30] tophit/[49:45] tophit객체표 보기/[50:26] reorder, theme_bw/[51:19] theme/[51:57] element_line/[52:50] geom_segment/[55:42] xend, yend, color 수치를 바꾼 결과/[56:50] 백그라운드와, 테마, 포인트를 변경한 결과/[58:11] y축 명칭의 재정렬

  • 1753분 데이터의 시각화(3)클리블랜드 점 그래프/선 그래프/축 정보 변경하기/여러 그룹 선 그래프/그래프에 음영 채우기/신뢰 영역 추가/산점도/산점도, 적합된 회귀선 추가

    책갈피 : [00:01] facet_grid/[00:42] 그래프 분할 결과 확인/[01:07] free_y/[01:59] space="free_y"/[02:29] ggplot을 이용한 선 그래프 그리기/[02:58] BOD데이터 내용 살펴보기/[03:45] x축 변수가 숫자형 변수일때/[04:10] 축정보 변경하기/[05:00] scale_y_continuous/[06:14] 순서를 바꾼 수행 결과/[06:51] ylim, scale_y_continuous/[07:28] coord_cartesian/[08:47] 코드 수행 결과/[09:24] expand_limits/[10:01] 점 추가하기/[10:11] geom_point/[10:49] 여러 선 그리기/[11:08] ToothGrowth데이터 살펴보기/[12:22] c("supp","dose")/[12:37] summarise/[13:18] 품목별 무게의 합계 결과보기/[14:31] 비타민 주입량에 따른 치아길이 평균 그래프/[15:15] group=supp/[15:57] colour=supp/[17:23] 그룹별로 포인트 모양을 바꾸는 방법/[18:29] 그룹별로 색상을 다르게 하는 방법/[19:12] 코드 수행 결과/[19:38] position_dodge/[20:03] x축이 명목형일 경우 선으로 연결하기/[20:44] 연결형과 명목형의 차이 알아보기/[22:08] group=1/[22:34] 그룹이 여러개인 데이터 프레임의 경우/[23:51] 맵핑정보와 그룹정보 표현/[24:50] climate데이터 살펴보기/[25:52] clim/[26:52] 그래프에 음영 넣기/[27:10] geom_area/[28:16] 코드 수행 결과/[28:55] geom_line/[29:22] 신뢰 영역 추가하기/[29:32] geom_ribbon/[30:37] 신뢰구간에 점선 경계선 추가하기/[31:20] 산점도/[31:38] heightweight데이터 살펴보기/[32:25] 코드수행 결과/[33:49] scale_colour_manual/[35:24] scale_shape_manual/[35:51] scale_fill_manual/[36:16] 도형의 모양과 채우는 방식을 다르게 표현하기/[36:51] heightweight group/[39:35] legend/[40:22] 연속변수를 색상이나 크기에 대입하기/[41:02] 코드수행 결과/[41:28] scale_colour_gradient/[42:21] 에스테틱스의 종류/[43:24] 연속변수를 크기에 대입한 결과/[43:55] scale_size_manual/[44:40] 코드 수행 결과/[45:58] scale_size_area/[47:19] 적합된 회귀선 추가하기/[47:30] 선형 모델로 데이터 적합/[49:06] 코드 수행 결과/[49:37] 비선형 모델로 데이터 적합/[52:04] 외삽법을 이용할 경우

  • 181시간 3분 데이터의 시각화(4)이미 만들어진 모형의 적합선 추가하기/그래프의 주석 및 라벨 추가하기/데이터의 분포 요약/히스토그램/밀도곡선/박스플롯

    책갈피 : [00:02] 만들어진 모형의 적합선 추가하기/[00:14] heightweight데이터 내용 확인/[01:43] geom_line/[01:50] 별도의 데이터 프레임/[02:25] newdata/[02:50] 코드 수행 결과/[04:04] 그래프 확인/[04:37] predvals 데이터 프레임 내용 확인/[05:33] 성별정보 산점도 그래프 보기/[06:20] 선형회귀분석/[06:43] plyr패키지/[07:46] models 내용 살펴보기/[08:15] f, m 회귀분석 수행 결과/[08:37] predict/[09:50] lm의 경우/[10:25] loess의 경우/[12:15] 그래프 확인/[13:00] xrange/[13:37] 외삽/[14:09] 모형개수들을 주석으로 추가하기/[14:21] 회귀분석 결과 살펴보기/[16:04] 코드 수행 결과/[16:20] parse=T/[17:04] inf, just/[19:09] just값을 조절한 코드 수행/[21:19] 텍스트 위치 변동을 위한 변경/[21:40] 텍스트 위치 변경 코드 설명/[22:00] 산점도의 점에 라벨 붙이기/[22:07] countries데이터 프레임 내용 확인/[22:55] df객체 내용/[23:38] annotate를 통한 주석 추가/[24:30] newdata 설정/[25:35] 코드 수행 결과/[26:08] geom_text/[26:53] size를 바꾼 수행 결과/[27:31] hjust, vjust/[28:48] x좌표, y좌표 치환/[29:31] hjust를 -1로 할 경우/[30:57] 일부열만 라벨을 붙이는 경우/[32:05] 데이터 분포 요약 방법/[32:22] 히스토그램/[32:27] geom_histogram/[32:52] faithful 데이터 살펴보기/[33:38] 간단한 히스토그램 그려보기/[34:37] width, fill, colour를 바꾼 히스토그램 결과/[35:11] /5 binsize/[36:03] origin/[37:54] ggplot/[38:53] 여러그룹을 히스토그램 생성하는 방법/[39:12] birthwt데이터 프레임 확인/[40:01] facet_grid(smoke~.)/[41:37] 라벨값을 조정한 결과/[42:34] revalue/[43:18] 코드 수행 결과/[43:42] facet_grid(race~.)/[44:45] scales="free"/[45:16] space="free"/[46:05] factor(smoke)/[47:06] position="identity"/[47:42] 밀도 곡선/[48:29] density/[48:51] expand_limits/[51:07] geom_histogram/[52:06] y=..density../[53:13] colour, fill/[54:27] facet_grid/[55:19] 박스 플롯/[55:29] 박스 플롯의 구성 살펴보기/[57:07] outlier.size, outlier.shape/[59:00] 옵션을 다르게한 세가지 그림을 비교해보기/[01:00:18] notch 삽입/[01:01:24] stat_summary

  • 1959분 데이터의 시각화(5)윌킨슨 점그래프/이차원 데이터의 밀도그래프 그리기/주석, 텍스트 주석넣기/선 추가하기/부분 강조하기/오차막대 추가하기/축, 축 정보 변경/눈금설정

    책갈피 : [00:01] geom_violin/[01:04] violin그래프/[02:42] trim=F/[03:29] scale="count"/[03:46] adjust/[04:26] 윌킨슨 점 그래프/[05:05] 코드 수행 결과/[05:22] geom_dotplot/[07:20] boxplot, dotplot의 좌표위치 수정/[08:51] 이차원 데이터의 밀도 그래프/[09:29] stat_density2d/[10:15] colour=..level../[10:52] alpha=..level../[12:25] alpha=..density../[12:45] geom="raster"/[13:49] 대역폭을 수정한 수행 결과/[14:20] 주석/[15:01] 텍스트 주석 넣기/[16:44] annotate, geom_text/[18:27] x=inf, x=-inf/[18:49] parse=T/[19:34] Function: '*/[20:37] %*%/[21:10] 선 추가하기/[22:40] 수평선과 수직선 그리기/[23:04] 각도가 잇는 선 추가/[23:06] geom_abline/[24:23] 코드 수행 결과/[24:43] geom_hline/[25:53] PlantGrowth데이터 프레임 살펴보기/[26:10] 명목형 변수값/[26:30] pg/[28:25] 선분을 추가하는 방법/[28:33] climate데이터/[29:44] 코드 수행 결과/[30:19] angle, length를 수정한 결과값/[31:10] 각도를 조절한 활용/[31:26] 부분 강조하기(음영추가)/[31:30] rect/[33:10] 오차 막대 추가하기/[33:27] geom_errorbar/[35:06] 코드 수행 결과/[35:31] dodge/[36:39] position_dodge(.9)/[37:26] geom_line, geom_point/[38:23] pd= position_dodge/[39:04] 분할면에 주석 넣기/[39:34] mpg데이터 살펴보기/[40:25] 기본분할 그래프 내용 살펴보기/[41:00] f_labels 생성/[43:00] 축 정보 변경/[43:22] 기본 그래프 외형 살펴보기/[44:59] limits=rev/[46:05] scale_x_discrete/[47:14] 코드 수행 결과/[48:33] scale_y_continuous/[48:50] ylim/[49:02] scale_y_reverse/[50:36] 눈금 설정/[50:52] sp + coord_fixed/[51:48] 코드 수행 결과/[52:39] breaks=seq/[53:20] ratio/[54:48] PlantGrowth/[55:58] scale_x_discrete/[57:23] theme/[57:35] element_blank/[58:34] 라벨과 눈금을 동시에 제거하는 코드 수행/[58:57] breaks=NULL

  • 2059분 데이터의 시각화(6)축, 눈금 라벨 변경/축 라벨 변경/축을 따라 선 표시/범례위치 조절/데이터 변형/데이터 부분집합 취하기/연속변수를 범주형 변수로 코딩/집단별로 변형/reshape

    책갈피 : [00:02] 눈금 라벨 변경/[00:14] axis.text, axis.title/[00:35] element_blank, element_text/[01:07] 눈금라벨 변경 코드 수행/[01:27] 텍스트 속성을 설정한 결과/[02:31] 축 라벨 변경/[03:58] 코드 수행 결과/[04:25] 축을 따라 선 표시/[04:34] theme_bw/[06:07] axis.line =element_line/[06:46] lineend="square/[07:07] 범례 제거 및 위치 설정/[08:05] 가이드를 이용한 코드 수행 결과/[08:22] scale_fill_discrete 효과/[08:59] legend.position/[10:03] legend.position의 좌표설정 살펴보기/[11:36] legend.justification/[12:39] legene.background/[13:13] theme()내에서 사용하는 테마 속성들/[13:36] element_rect()/[14:43] 설정값을 변경안 코드 수행 결과/[16:01] legend.key = element_blank/[16:34] 데이터 변형 항수/[18:04] PlantGrowth데이터셋 살펴보기/[18:46] subset/[19:37] 코드 수행 결과/[21:15] 대괄호를 이용한 인덱싱 방법/[22:07] with함수/[22:49] transform, mutate/[24:47] 코드 수행 결과/[25:46] cut/[26:10] 결측치/[27:26] NA로 코딩되는 예/[28:06] 명목형 변환/[28:12] wtclass/[28:36] 코드 수행 결과/[29:12] cabbages내용 살펴보기/[31:02] Cult/[32:45] ddply/[36:00] .drop.F/[36:33] 데이터에 결측치가 좋재할때/[36:53] 코드 수행 결과/[38:22] is.na/[38:30] 평균, 표준편차. 빈도수/[38:57] ci/[38:56] 신뢰구간/[39:18] se=sd/[39:54] qt함수/[41:03] 코드 수행 결과/[42:35] summarySE/[42:55] summarise/[44:05] r에서의 장점/[44:34] 신뢰구간 코드 수행/[45:22] ggplot/[45:44] geom_bar, geom_errorbar/[46:12] geom_text/[46:57] 코드 수행 결과/[47:23] reshape2패키지/[50:11] melt함수 적용/[51:11] drunk 예시 살펴보기/[52:19] plum_wide 예시 살펴보기/[54:02] co=corneas/[55:38] dcast/[56:14] 두개의 측정변수가 있는 경우






본 강의 수강생들의 추가구매가 가장 많은 학과.