2016-03-07 빅데이터 분석 기법의 이해와 활용 - 연세대학교 정보대학원 수업내용
•빅 데이터(big data)란 기존 데이터베이스 관리도구로 데이터를 수집, 저장, 관리, 분석할 수 있는 역량을 넘어서는 대량의 정형 또는 비정형 데이터 집합 및 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술을 의미한다
(위키피디어)
1기가 이상의 데이터는 R에서 읽을 수 있음.
사실 SAS가 더 좋은거 같음.
단, 가격이 비싸고, 해당 기능외에는 사용할 수 없음. (한 카피당 5000만원)
R커뮤니티 (각종 패키지 )
TaskView를 누르면 패키지랑 설명을 알 수 있음음
* Rpart 의사결정 나무 패키지
# 설치하고
install.packages(rpart)
# 설치된거 부르기
library(rpart)
Rstudio 자동 줄 바꿈 설정
R 조건문
Barplot
평균 변수간 차이만 찾아가면 되는 부분.
Q4.
Sapply 사용
Barplot
제외된 챕터
- 병렬처리 항목
Do pararel
foreach
- SQL관련
MySQL과 DB와 연결
SQLdf 패키지.
데이터 프레임이 SQL문장대로 결과처리해서 알려줌.
SQL로 해서 해봐야지.
'AI 인공지능 (딥러닝)' 카테고리의 다른 글
2015-10-11 텍스트마이닝 성능 지표 - 연세대학교 정보대학원 수업내용 (0) | 2018.04.20 |
---|---|
2015-05-23 Seminar with JP Hahn - 연세대학교 정보대학원 수업내용 (0) | 2018.04.08 |
2015-05-22 Seminar with JP Hahn - 연세대학교 정보대학원 수업내용 (0) | 2018.04.06 |
2015-05-22 Deep dive Seminar with JP Hahn - 연세대학교 정보대학원 수업내용 (0) | 2018.04.05 |
2015-04-11 R을 이용한 연관관계분석 기법 (0) | 2018.03.17 |