2016-03-07 빅데이터 분석 기법의 이해와 활용  - 연세대학교 정보대학원 수업내용

•빅 데이터(big data)란 기존 데이터베이스 관리도구로 데이터를 수집, 저장, 관리, 분석할 수 있는 역량을 넘어서는 대량의 정형 또는 비정형 데이터 집합 및 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술을 의미한다
(위키피디어)
 
1기가 이상의 데이터는 R에서 읽을 수 있음.
 
사실 SAS가 더 좋은거 같음.
단, 가격이 비싸고, 해당 기능외에는 사용할 수 없음. (한 카피당 5000만원)
 
R커뮤니티 (각종 패키지 )
 
TaskView를 누르면 패키지랑 설명을 알 수 있음음
 
* Rpart 의사결정 나무 패키지
 
# 설치하고
install.packages(rpart)
# 설치된거 부르기
library(rpart)
 

 

Rstudio 자동 줄 바꿈 설정
 
R 조건문

 
Barplot
평균 변수간 차이만 찾아가면 되는 부분.
 
Q4.
Sapply 사용
Barplot
 
제외된 챕터
 - 병렬처리 항목
  Do pararel
  foreach
 - SQL관련
  MySQL과 DB와 연결
  SQLdf 패키지.
데이터 프레임이 SQL문장대로 결과처리해서 알려줌.
 
SQL로 해서 해봐야지.
 
 
 

+ Recent posts