2015-05-07 사회과학 연구방법론 - 연세대학교 정보대학원 수업내용

통계는 양적 연구에 필수적인 툴
SPSS 21 사용
이건 사실 다른 사람들에게 용역을 줄 수도 있는 부분.
다만, 데이터를 모아놓았어야 하며, 어떤 테스트가 필요한지는 알아야 하죠.
이번에는 PLS까지 할거에요.
기본 지식을 습득하는 시간.
석사 학위 논문은 충분히 돌릴 수 있음.
많이 알면 알 수록 좋긴함.
 
통계 용역을 해주면서 교수님들과 공동 저자로 논문을 많이 냈었음.
박사학위 졸업전에 tenure를 딸 정도로 많은 논문을 냈음.
 
실습 내용이 학기말 시험에 10% 반영
 
보통 3가지 결과가 들어가게 된다.
1. 샘플에 대한 소개를 해주는 통계가 필요.
 - 성별, 나이, 기타 등등
2. 신뢰도랑 타당도 체크
3. 가설 테스팅 결과.
 
분산: 내 데이터가 얼마나 퍼져있는가. (평균값과 개별값과의 차이)
 
지난학기 중간고사 성적이 76점 이번학기 중간고사 85점이더라.
이번 학기 수강생들의 학력이 더 높은 것인가?
평균 값만으로는 이야기 하기 힘들다. 분산을 이해하는 것이 중요하다.
Skewness 얼마나 치우처져 있는지. (봉우리가 오른쪽으로 치우처 있다 등)
Kurtosis 첨도. 얼마나 뾰족한지.
 

 
신뢰도가 낮은 bad apple을 빼고 통계를 돌림.
PLS는 CFA임
EFL과 크론바알파
PLS는 갑론을박이 많음.

 
솔직하기만 하면 된다.
 - 일반적인 방법으로 테스트를 했는데, 결과가 잘 안나왔다. 그래서 더 적합한 방법인 최신의 통계 기법을 사용했다. 라고 밝히기만 하면 된다.
 
실습은 모수통계로 전부함.
비모수통계.
 
<통계 1강>
기말고사 때, 실습 시험도 있음.
수업시간에 나온 것 말고도 보기 때문에
통계 퀴즈. 오픈 노트북. 통계시간 마지막 날에 봄.
기말고사는 오픈북이 아님. 비중이 좀 있음.
 
논문을 쓰는 데에 있어서 가장 기본적인 통계만 배운다.
 
통계의 근거가 어떻게 산출되었는지 알고 싶으면 다음의 강의를 참조할 것.
Basic Statistical technique in the IT industry
(이상우 교수님)
정량적 데이터 분석 및 설계
(김희웅 교수님, for Ph.D.)
 
타당성과 신뢰도가 제대로 확보되지 않은 설문 문항은 다른 연구자들에게 많은 피해를 주게 된다.
 
# EFA vs CFA
 
EFA (Exploratory Factor Analysis)  - 여러 논문에서 가져왔을 때
Necessary for Empirical research
CFA (Confirmatory Factor Analysis) - 이론에서 가져온 경우. 한 논문에서 가져온 경우.
단, SPSS에서는 CFA를 못함.
 
# 수렴타당성
For convergent validity
 
각 설문 문항이 각 변수를 정확하게 측정하고 있는가.
Factor loading 책에는 0.5로 되어 있다. 0.5가 넘으면 제대로 측정하고 있다고 할 수 있음.
 
분석 > 차원감소 > 요인분석> 요인회전

 
요인 - 비슷한 설문항목끼리 뭉쳐놓은 것.
 

 
변수 4개 설문항목 22개면, 고유값이 1 넘는게 적어도 4개 이상이어야 함. 그리고 총 분산의 누적 %가 60% 이상이어야 함.
 

 
스크리 도면 - 기울기의 완만함이 어디부터 시작하는지를 보면 해당 변수를 사용할 수 있는 여지가 있음.

항상 회전된 성분행렬을 본다고 생각할 것.
 

 
 - 다른 변수 측정항목이 모인 경우 삭제
 - 0.5 이하면 삭제
 - 멀티로딩 에러 삭제
 
Internal consistency: 처음부터 끝까지 한결같은 성질
논문의 주제가 바뀌더라도 해당 변수를 측정하고 있는지를 봐야함.
크론바 알파 값을 본다.
 
p171 에 신뢰성 검정
 

이 화면이 나오게 하려면,
 

이 단계에서 작은계수 표시 안 함 체크 풀면 된다.
 
# 상관분석
변수간의 유사성 측정을 위해 각 변수들의 평균 값을 계산하여 비교한다.
변환>변수계산> 평균 계산 식 코딩하고 결과값 도출
상관 계수 도출.
 

Pearson 상관계수 0.6 이상이면 변수간 유사성이 높기 때문에 다중공선성 확인이 필요하다라고 서술해야 함.
(전제가 독립변수임. 일반적으로 종속변수를 넣어서 검증하기도 함. 그러면 종속변수와 유사성이 발견되면 해당 변수는 빼도 된다.)
 
 
mCom4 가 종속변수
 
PLS를 사람들이 많이 쓰는데, EFA를 어떻게든 통과 시키는 것이 중요할 듯. 안된다면 PLS를 쓰긴 하겠지만…
(PLS는 CFA에서만 사용해야 하기 때문)
 

 
사회과학 분야는 추상적인 분야임. 0.4~0.6 이면 굉장히 높은 것임. 너무 높으면 연구할 필요가 없을 정도로 명확한 사회현상이라고도 할 수 있음.
가능성이 있다. 라는 표현에 가까움. 유의한
 

 
 
외울 것.

 

+ Recent posts