2015-05-30 [통계] PLS 간단 설명 버전

Smart PLS를 이용한 CFA(확인적요인분석)과 가설검정 
 
오늘도 제가 이해한 것을 기반으로 PLS를 정리해 보려고 합니다.
 
PLS(Partial Least Square)는 하나의 분석 툴이라고 생각하시면 될것 같네요!
AMOS를 이용해서 수렴타당성, 판별타당성이 있는지를 알아보았던 것처럼
PLS 프로그램을 이용해도 수렴타당성, 판별타당성을 알아 볼 수 있습니다.
 
PLS는 종류도 많고 유료도 있고 무료도 있다고 하더라구요!
 
그런데 제가 배운 PLS는 Smart PLS라도 하는 무료 프로그램입니다^^
 
자 그럼 프로그램 설치부터 수렴타당성 및 판별타당성 구하는 것까지 즉 CFA 하고
그리고 난 뒤에는 가설 검증까지 정리해 보겠습니다.
 
이게 100% 맞다고 장담할수는 없으니까..
보시고 틀린 부분 있으면 COMMENT 해주세요!! 환영합니다^^
 
아... 그리고 혹시라도 이 글을 어딘가로 가져가신다면 출처라도 남겨주시면..
나름 열심히 정리한 거라서요!!ㅋㅋ
 
1. 프로그램 설치
  - http://www.smartpls.de/forum/   이 사이트로 들어가서요. 가입하세요!!
    영어로 되어 있는데 화면 우측 하단에 보시면 "Register now"가 있어요.
    그 옆에는 It's free 라는 반가운 문구도 ㅋ
  - 가입 후 승인이 되야지 프로그램을 설치 할 수 있어요. 저 같은 경우는 4시간만에 승인이
     떨어졌는데 보통 하루 걸린다고 생각하면 된다고 하더라구요
  

  - 위에 그림에서 보시면 제가 박스 그려 넣은게 보이시져? "my key"와
     "Download SmartPLS 2.0" 이부분만 기억하시면 되요^^
     먼저 다운로드 받으시구요 MY KEY 부분에 있는 부분은 나중에 설치 후 붙여
     넣어주시면 되요
     일종의 serial number라고 생각하시면 될것 같아요 :)
 
  - 설치가 되셨으면 이제 프로그램을 실행시켜봐요
 
2. CFA(확인적 요인분석)
  - 새로운 프로젝트를 하나 만들어야 합니다.

 
 
  - 프로젝트 이름을 넣으시면 됩니다. 전 "연습2"라고 적었습니다!

 
 
  - 프로젝트 이름을 적고 나면 아래와 같이 입력할 자료를 선택하라고 나옵니다.
     이때 파일은 csv파일만 입력이 됩니다. spss에서 다른이름으로 저장하시거나
     엑셀에서 다른이름으로 저장하시면 됩니다^^

 
 
  - 짜잔 아래와 같이 연습2라는 프로젝트가 생겼습니다. 그 중 "연습2.spism " 를 누르면
     AMOS와 같은 팔레트가 나옵니다.^^ 이제 원하는 모양으로 그리시면 됩니다.
     이부분이 정말 AMOS 보다 훨씬 간단하고 깔끔한거 같아요^^

 
 
 
  - 제가 동그라미 친 두 아이콘을 이용해서 그림을 그리시면 되요!!
    먼저 왼쪽 동그라미는 construct라고 생각하시면 되요. 아래서 보여드리겠지만 전 SP, Intent,
    Trust 라는 세가지 construct를 가지고 CFA와 판별타당성 분석을 했습니다!!
    왼쪽 동그라미를 이용해서 construct를 그리셨다면, 오른쪽에 있는 아이콘을 이용해서 construct
    들을 연결시켜 주시면 됩니다.
  - 그러고 난 뒤 화면 좌측 하단에 있는 Indicators 들 중에 SP에 연결될 것들을 다 선택하신 후
     드래그 하셔서 원안까지 갖고 오신 후 마우스를 버튼 놓아주시구요, 나머지 것들도 그렇게
     해주시면요 저기 아래와 같은 그림이 탄생하게 되는 겁니다!!

 
 
- 그리기 완성된 화면

 
  - 이제 실제 CFA를 하기 위해 "Calculate> PLS Algorithm"을 선택 한후 화살표 옆에 있는 아이콘을
    눌러 "Html Report"를 보자!!
 
  - 그러면 새창이 뜨면서 결과값들이 주르륵 나오는데
    이중 우리가 볼 것은 "PLS> Quality Criteria> Overview" 부분이에요.
 
  - 위 결과값들을 토대로 분석결과를 정리해 보면 아래와 같구요.
 
 
AVE
Composite Reliability
R Square
Cronbachs Alpha
Communality
Redundancy
Intent
0.680
0.862
0.587
0.769
0.680
0.174
SP
0.737
0.918
 
0.880
0.737
 
Trust
0.868
0.952
0.587
0.924
0.868
0.510
AVE 값은0.5 이상, Composite reliability0.7 이상, Cronbachs Alpha 값도0.7이상이면수렴타당성이있다고함
 
 
 
 
 
 
 
  * 여기서 Composite Reliability는 construct와 item과의 관계가 잘 되어 있는지를 보는 것이고,
     Cronbachs Alpha  item간의 관계가 얼마나 신뢰성이 있는지를 보는 것이라고 하네요!
 
  * 여기서 AVE는 분산추출지수로써 일반적으로 0.5 이상 되어야 수렴타당성이 있다고 한다.
     AMOS에서는 AVE를 구하려면 엑셀에서 따로 계산해야 된다.. 참 불편했는데 여기서는
     그냥 한번에 보여줘서 넘 좋았다는 ㅋㅋ
 
  - 아래 표는 각각의 개념들이 독립적이어서 가설을 검정해도 되는 정도의 개념들인지를 보기
    위해 판별타당성을 본 결과에요. 음영이 들어가 있는 부분이 AVE 값에 루트를 씌운 값이구요.
    판별타당성 역시 있다고 나왔습니다.^^
 
 
Intent
SP
Trust
Intent
0.824
 
 
SP
0.674
0.858
 
Trust
0.751
0.766
0.932
AVE
0.680
0.737
0.868
AVE에루트값을씌운것은AVE를표준화시켰다는것인데이러한AVE에루트를시킨값중가장작은값이각각의상관계수보다크다면판별타당성이있다고할수있다.
=> 0.824 > 0.766  따라서판별타당성이있다고함.(서로다른변수들임)
 
 
 
 
 
3. 가설검정하기
- 복잡했던 요인분석이 끝나면 드디더 가설을 검정해 볼 수 있습니다.
- "Calculate> Bootstrapping"을 선택해 보면 화면 하단에 Cases 와 Samples가 있어요.
   여기서 Cases는 입력한 데이터의 n수이고, Samples는 Bootstrapping을 할 숫자에요.
   일반적으로 500~1000을 입력한다고 합니다.
   즉 정해진 데이터를 가지고 여러번 돌려서 Sample들을 만들어서 분석을 하는 것이에요.
   그래서 예측력에 있어서 효과가 좋은 프로그램이라고 합니다
- 아까와 마찬가지로 Html Report를 확인해 보면 아래와 같은 결과를 알 수 있습니다.
 
Total Effects (Mean, STDEV, T-Values)
 
Original Sample (O)
Sample Mean (M)
Standard Deviation (STDEV)
Standard Error (STERR)
T Statistics (|O/STERR|)
SP -> Intent
0.673745
0.673743
0.040579
0.040579
16.603403
SP -> Trust
0.765995
0.766053
0.032651
0.032651
23.460237
Trust -> Intent
0.567607
0.565374
0.079516
0.079516
7.138250
 
  - Smart PLS에서는 따로 유의수준을 표시하여 주지않기 때문에 그 부분은
    연구자가 직접 해야 될것 같습니다.
 
  - 일반적으로 샘플수가 일정 수준 이상이면 t값은 아래와 같다고하네요ㅋ

 
  - 따라서 본 모델의 가설은 모두 의미가 있다고 볼 수 있습니다!!
 
  - 정리해 놓고 보니 역시 엄청 기네요...
     다 머리속에 들어와야 될텐데...ㅋㅋㅋㅋ
 
  - 다음번에는 여유가 되면 차근차근 되짚어서 정리해 볼까 합니다^^
 
 
 
 
 
 
 
2015-05-28 사회과학 연구방법론 - 연세대학교 정보대학원 수업내용

-- 통계 시험 준비 --
 
경험적 연구(empirical research)는. 연구자가 직접 조사하여 어떠한 결과가 나오는 지를 직접 관찰하는 연구. 
 
 
-- 수업 --
 
조절변수 확인
 

 
그런데 조절 변수가 등간 척도로 구분되어 있음

 
csv 파일 2개 생성.
 
사후분석이라는 타이틀을달아서 요인분석 같은 분석 뒤에 사용하는 과정
이미 기각된 가설에 대해서는 사후분석을 할 필요가 없음.
 
* Chin's analysis
조절효과분석.
사실, chin의 논문을 읽어보면, 이 분석을 사용해서 유의미한 결과가 나온다면, 모든 가설에 대한 조절변수로서 작용한다고 할 수 있다. 하지만, 그렇게 되면 Review들에게 많은 공격을 받기 때문에 중요하게 생각하는 조절변수의 값만 영향을 미친다고 하는 것을 권장함.
 
- chin의 t값
해당 값을 계산할 수 있는 엑셀시트를 이용. (경로계수차이검정(Chin).xlsx )

 
# 관리 194명
 
PLS에서 t-value는 부스트랩핑 해서 경로 위에 써있는 숫자.

 
경로계수값 Path coefficient

 
Total Effects (Mean, STDEV, T-Values)
 
Original Sample (O)
Sample Mean (M)
Standard Deviation (STDEV)
Standard Error (STERR)
Privacy Concern -> Privacy Stress
0.412694
0.412377
0.051459
0.051459
Workload -> Privacy Stress
0.475487
0.477201
0.049735
0.049735
 
 
T Statistics (|O/STERR|)
Privacy Concern -> Privacy Stress
8.019889
Workload -> Privacy Stress
9.560490
 
 
# 테크 164명
 
t-value

 
경로계수값 Path coefficient

 
Total Effects (Mean, STDEV, T-Values)
 
Original Sample (O)
Sample Mean (M)
Standard Deviation (STDEV)
Standard Error (STERR)
Privacy Concern -> Privacy Stress
0.344454
0.343613
0.072272
0.072272
Workload -> Privacy Stress
0.516408
0.519274
0.063252
0.063252
 
 
T Statistics (|O/STERR|)
Privacy Concern -> Privacy Stress
4.766060
Workload -> Privacy Stress
8.164269
 
매개효과 분석 1

 

 
매개효과 분석 2
Sobel Test
 

 
 
2015-05-21 사회과학 연구방법론 PLS - 연세대학교 정보대학원 수업내용

왜 PLS를 쓰는가?
 - 구조방정식: 전체적인 연구 모형에 대한 검토를 위해
 - 선형회기분석: 각 가설간의 연관관계를 보기 위해
언제 PLS를 쓰는지?
 - 설문조사 샘플의 크기가 작을 경우에 사용. (predictor x 10)
  -- predictor : 가장 많이 영향을 받는 요인의 숫자 (화살표를 몇 개를 받는가)
 - formative 관계일 때 사용한다. (M1,2,3 만이 오직 A라는 변수를 측정하는 항목인 경우)

  - 하지만, 일반적으로 편해서 PLS를 사용하는 경우가 많음…
 
 

 
지금 진행하는 과정은 CFA임. (강제로 짝을 맞추어 주는 과정)
EFA는 PLS에서는 할 수 없음. (SPSS에서 EFA 분석을 먼저 진행하고 PLS로 돌려도 된다)
로딩값 충족하지 않는 변수를 제거해야 함.

 
Samples를 500~1000을 선행 연구에서는 주로 사용하였다. (크면 클 수록 결과가 잘 나오는 듯)
PLS의 경우, 돌릴 때 마다 수치가 조금씩 달라지는 경우가 있음.
가설이 모두 기각되는 경우 단측 검정을 사용하는 경우도 있음.
 
Factor Loading 값 측정. (리포트 -> 디폴트 리포트)

 
Original Sample 0.7 이하는 삭제하면 되는데, 가장 작은 변수 하나씩 지우고 돌려보고 하는 작업을 반복해야 함. (변수를 하나라도 더 살리기 위해)
 

계산한 스퀘어 루트 값은 1 대신에 집어 넣으면 된다.
판별타당성과 수렴타당성 체크.
Correlations이 0.6 이상이면 SPSS에서 회기분석까지 가야함. 다중 공선성이 의심되기 때문에.
 
 
2015-05-14 사회과학 연구방법론 - 연세대학교 정보대학원 수업내용

--- 복습 ---
 
PLS 는 퀴즈 범위에 포함되지 않음.
SPSS만 퀴즈 범위에 포함된다.
 
PLS가 시험범위에 포함되는지?
 
1. 타당성을 체크하기 위해 요인 분석을 함.
Factor Loading
 
2. 신뢰도 분석
 
--- 팀플 Tip ---
채택되지 않은 가설에 대해서는 크게 언급하지 않는 것이 좋음.
 
--- 수업 ---
 
* Reverse Coding
- 설문자가 제대로 답변을 했는지에 대해 검증을 하기 위해. (제대로 답변하지 않은 내용은 삭제)
- 실무적으로 논문을 위한 설문에서는 잘 쓰이진 않는다. 다만 퀴즈나 시험에 나옴.

 
변환 -> 다른 변수로 코딩 변경 -> 기존값 및 새로운 값
 
* 교차분석
등간척도가 아니라 명목척도이기 때문에 교차분석을 사용하기 때문에, 실제 연구나 논문에서 사용하는 경우는 많이 없다.(범주형 척도) 변수간의 관계가 있는지 없는지를 측정하기 위해 쓰임. 
 
* T-Test
주요 논문의 시사점으로 쓰는 것은 아니고, 추가적인 시사점을 도출하기 위해 쓰임.
한 변수에 대해 두 집단 간의 차이 여부 확인.
중앙값으로 나누기 어려운 경우에는 평균으로 나눌 수도 있다.
실험의 경우에는 T-테스트를 쓸 수 밖에 없음.
 
* ANOVA
한 변수에 대해 보통 세 집단 이상 간의 차이 여부 확인.
Scheffe 분석이나 Duncan 분석 등 사후 분석을 사용해야 한다.
 
* 빈도분석
일반적으로 설문 응답자의 인구통계학적 분석
빈도 분석시, 라벨링 작업이 필요 (나이를 20대라고 체크하지 않고 27살 이런식으로 기입하도록 한 경우)
 
* 측정 항목의 개수
최종 활용되는 변수 1개에 활용되는 설문 문항은 최소한 3개가 필요. (4개 권장)
 
 
 
 
 


+ Recent posts