2015-05-30 [통계] PLS 간단 설명 버전

Smart PLS를 이용한 CFA(확인적요인분석)과 가설검정 
 
오늘도 제가 이해한 것을 기반으로 PLS를 정리해 보려고 합니다.
 
PLS(Partial Least Square)는 하나의 분석 툴이라고 생각하시면 될것 같네요!
AMOS를 이용해서 수렴타당성, 판별타당성이 있는지를 알아보았던 것처럼
PLS 프로그램을 이용해도 수렴타당성, 판별타당성을 알아 볼 수 있습니다.
 
PLS는 종류도 많고 유료도 있고 무료도 있다고 하더라구요!
 
그런데 제가 배운 PLS는 Smart PLS라도 하는 무료 프로그램입니다^^
 
자 그럼 프로그램 설치부터 수렴타당성 및 판별타당성 구하는 것까지 즉 CFA 하고
그리고 난 뒤에는 가설 검증까지 정리해 보겠습니다.
 
이게 100% 맞다고 장담할수는 없으니까..
보시고 틀린 부분 있으면 COMMENT 해주세요!! 환영합니다^^
 
아... 그리고 혹시라도 이 글을 어딘가로 가져가신다면 출처라도 남겨주시면..
나름 열심히 정리한 거라서요!!ㅋㅋ
 
1. 프로그램 설치
  - http://www.smartpls.de/forum/   이 사이트로 들어가서요. 가입하세요!!
    영어로 되어 있는데 화면 우측 하단에 보시면 "Register now"가 있어요.
    그 옆에는 It's free 라는 반가운 문구도 ㅋ
  - 가입 후 승인이 되야지 프로그램을 설치 할 수 있어요. 저 같은 경우는 4시간만에 승인이
     떨어졌는데 보통 하루 걸린다고 생각하면 된다고 하더라구요
  

  - 위에 그림에서 보시면 제가 박스 그려 넣은게 보이시져? "my key"와
     "Download SmartPLS 2.0" 이부분만 기억하시면 되요^^
     먼저 다운로드 받으시구요 MY KEY 부분에 있는 부분은 나중에 설치 후 붙여
     넣어주시면 되요
     일종의 serial number라고 생각하시면 될것 같아요 :)
 
  - 설치가 되셨으면 이제 프로그램을 실행시켜봐요
 
2. CFA(확인적 요인분석)
  - 새로운 프로젝트를 하나 만들어야 합니다.

 
 
  - 프로젝트 이름을 넣으시면 됩니다. 전 "연습2"라고 적었습니다!

 
 
  - 프로젝트 이름을 적고 나면 아래와 같이 입력할 자료를 선택하라고 나옵니다.
     이때 파일은 csv파일만 입력이 됩니다. spss에서 다른이름으로 저장하시거나
     엑셀에서 다른이름으로 저장하시면 됩니다^^

 
 
  - 짜잔 아래와 같이 연습2라는 프로젝트가 생겼습니다. 그 중 "연습2.spism " 를 누르면
     AMOS와 같은 팔레트가 나옵니다.^^ 이제 원하는 모양으로 그리시면 됩니다.
     이부분이 정말 AMOS 보다 훨씬 간단하고 깔끔한거 같아요^^

 
 
 
  - 제가 동그라미 친 두 아이콘을 이용해서 그림을 그리시면 되요!!
    먼저 왼쪽 동그라미는 construct라고 생각하시면 되요. 아래서 보여드리겠지만 전 SP, Intent,
    Trust 라는 세가지 construct를 가지고 CFA와 판별타당성 분석을 했습니다!!
    왼쪽 동그라미를 이용해서 construct를 그리셨다면, 오른쪽에 있는 아이콘을 이용해서 construct
    들을 연결시켜 주시면 됩니다.
  - 그러고 난 뒤 화면 좌측 하단에 있는 Indicators 들 중에 SP에 연결될 것들을 다 선택하신 후
     드래그 하셔서 원안까지 갖고 오신 후 마우스를 버튼 놓아주시구요, 나머지 것들도 그렇게
     해주시면요 저기 아래와 같은 그림이 탄생하게 되는 겁니다!!

 
 
- 그리기 완성된 화면

 
  - 이제 실제 CFA를 하기 위해 "Calculate> PLS Algorithm"을 선택 한후 화살표 옆에 있는 아이콘을
    눌러 "Html Report"를 보자!!
 
  - 그러면 새창이 뜨면서 결과값들이 주르륵 나오는데
    이중 우리가 볼 것은 "PLS> Quality Criteria> Overview" 부분이에요.
 
  - 위 결과값들을 토대로 분석결과를 정리해 보면 아래와 같구요.
 
 
AVE
Composite Reliability
R Square
Cronbachs Alpha
Communality
Redundancy
Intent
0.680
0.862
0.587
0.769
0.680
0.174
SP
0.737
0.918
 
0.880
0.737
 
Trust
0.868
0.952
0.587
0.924
0.868
0.510
AVE 값은0.5 이상, Composite reliability0.7 이상, Cronbachs Alpha 값도0.7이상이면수렴타당성이있다고함
 
 
 
 
 
 
 
  * 여기서 Composite Reliability는 construct와 item과의 관계가 잘 되어 있는지를 보는 것이고,
     Cronbachs Alpha  item간의 관계가 얼마나 신뢰성이 있는지를 보는 것이라고 하네요!
 
  * 여기서 AVE는 분산추출지수로써 일반적으로 0.5 이상 되어야 수렴타당성이 있다고 한다.
     AMOS에서는 AVE를 구하려면 엑셀에서 따로 계산해야 된다.. 참 불편했는데 여기서는
     그냥 한번에 보여줘서 넘 좋았다는 ㅋㅋ
 
  - 아래 표는 각각의 개념들이 독립적이어서 가설을 검정해도 되는 정도의 개념들인지를 보기
    위해 판별타당성을 본 결과에요. 음영이 들어가 있는 부분이 AVE 값에 루트를 씌운 값이구요.
    판별타당성 역시 있다고 나왔습니다.^^
 
 
Intent
SP
Trust
Intent
0.824
 
 
SP
0.674
0.858
 
Trust
0.751
0.766
0.932
AVE
0.680
0.737
0.868
AVE에루트값을씌운것은AVE를표준화시켰다는것인데이러한AVE에루트를시킨값중가장작은값이각각의상관계수보다크다면판별타당성이있다고할수있다.
=> 0.824 > 0.766  따라서판별타당성이있다고함.(서로다른변수들임)
 
 
 
 
 
3. 가설검정하기
- 복잡했던 요인분석이 끝나면 드디더 가설을 검정해 볼 수 있습니다.
- "Calculate> Bootstrapping"을 선택해 보면 화면 하단에 Cases 와 Samples가 있어요.
   여기서 Cases는 입력한 데이터의 n수이고, Samples는 Bootstrapping을 할 숫자에요.
   일반적으로 500~1000을 입력한다고 합니다.
   즉 정해진 데이터를 가지고 여러번 돌려서 Sample들을 만들어서 분석을 하는 것이에요.
   그래서 예측력에 있어서 효과가 좋은 프로그램이라고 합니다
- 아까와 마찬가지로 Html Report를 확인해 보면 아래와 같은 결과를 알 수 있습니다.
 
Total Effects (Mean, STDEV, T-Values)
 
Original Sample (O)
Sample Mean (M)
Standard Deviation (STDEV)
Standard Error (STERR)
T Statistics (|O/STERR|)
SP -> Intent
0.673745
0.673743
0.040579
0.040579
16.603403
SP -> Trust
0.765995
0.766053
0.032651
0.032651
23.460237
Trust -> Intent
0.567607
0.565374
0.079516
0.079516
7.138250
 
  - Smart PLS에서는 따로 유의수준을 표시하여 주지않기 때문에 그 부분은
    연구자가 직접 해야 될것 같습니다.
 
  - 일반적으로 샘플수가 일정 수준 이상이면 t값은 아래와 같다고하네요ㅋ

 
  - 따라서 본 모델의 가설은 모두 의미가 있다고 볼 수 있습니다!!
 
  - 정리해 놓고 보니 역시 엄청 기네요...
     다 머리속에 들어와야 될텐데...ㅋㅋㅋㅋ
 
  - 다음번에는 여유가 되면 차근차근 되짚어서 정리해 볼까 합니다^^
 
 
 
 
 
 
 
2015-05-28 IT 평가 방법론 - 연세대학교 정보대학원 수업내용

IT Invest management에 대한 전반적인 내용
 
Sun, Yongqiang., Y. Fang, KH. Lim, and Detmar Straub. (2012). User Satisfaction with Information Technology Service Delivery: A Social Capital Perspective. Information Systems Research. 23(4). pp. 1195~1211.
김동욱
 

이 논문에서 Social capital을 가장 중요한 것으로 제시. 
ex) 콜만 -> 후쿠야마 -> 로버트 포트만
(혼자 볼링하기) 
볼링을 점점 미국사회에서 혼자서 하는 경향성이 나타남.
맥주와 피자 소비도 볼링의 경향성과 거의 정합성을 나타났음.(감소 곡선) 
사회적 자본의 감소가 물적 자본의 붕괴로 이어짐.
현대사회에서 중요한 변수가 social capital, 사회적 자본의 중심에는 사용자 커뮤니케이션이 있고, 커뮤니케이션에는 적어도 2사람이 있다.
 
p1197

cognitive appraisal emotional response coping behavior framework
(Service Quality →  User satisfaction →  Performance)
 
* 정보시스템 관리자와 의사소통 하고 있으십니까? 이런식으로 접근했다.

 

 

 

 
 
이 결과가 이 논문의 핵심임.
 

 
 
2번째 중요한 점. 소셜 캐피탈이 서비스 퀄리티에 어떤 영향을 주고 받는지에 대한 내용임.

 
소셜 캐피탈이 국가별, 지역별 차이가 나는 것이 아닌가.
샘플 사이즈가 작다.
 
 
U.S Department of Energy(2010). Guide to IT Capital Planning and Investment Control(CPIC).
Office of the Chief Information Officer.
이재빈
 
IT 투자 Overview가 주제. (미국 에너지 부)

 
CPIC은 미국의 컨설팅 업체들의 컨소시엄에서 만들어졌음.
OMB의 일반 CPIC가이드를 만들었음.
CPIC가이드에 따라서 미국 에너지 부에서 실제로 적용한 부분임. 
 - Control: Cost, Schedule, Performance 주기적으로 관리
 - Evaluate: 평가의 결과를 향후 투자 여부에 피드백을 주고, 벤치마킹도 거친다.
 - Select
 
 

우리는 보통 1년뒤에 사후 평가를 진행함
 
* ROI는 사전 선정 단계에서 진행함. (사후평가에서 하는 것이 아님)
사전 선정 단계가 정말 중요함. 왜냐하면, 퍼포먼스에 대한 모니터링을 할 수 있는 이유가 ROI 에서 핵심 Indicator(KPI)를 정하고 진행하고 있기 때문임.
 문제가 발생하면 바로 심의위원회를 만든다(Review Board)
 
ISACA - 비슷하게 VAL-IT, COB-IT, RISK-IT 프레임 워크를 만들었음. 현재 우리나라에서 사용중임.
해당 논문은 2010년에 나옴
 
 
U.S Office of Management and Budget(2012). fy14 guidance on exhibits 53 and 300
: Information Technology and E-government. OMB.
이청훈

 
53은 기관 단위로 나온 것임.
300은 종합. (+민간기업) 
 
Exhibit 53
 - Current UII : 정보시스템 개발/구축 고유 식별 번호(주민번호 같은 것)
이걸 치면, 시스템에 대한 전반적인 정보를 파악할 수 있고, 폐기 비용과 시점까지도 알 수 있음.
 
 - 이 글에서 Major IT 투자를 (50만불 이상) 진행한다면 반드시 추가적인 분석이 필요하다고 이야기 하고 있음.
 미국은 위험분석, 대안분석, 비용편익분석을 함. 우리나라는 못하고 있음.
 
Salge, Torsten Oliver., Kohli, Rajiv. and Michael Barrett. (2015). Investing in Information Systems
: On the Behavioral and Institutional Search Mechanisms Underpinning Hospitals’ IS Investment Decisions. MIS Quarterly, 39(1). pp. 61~89.
박영주
 
오늘날 정보시스템은 새로운 비즈니스 모델을 창출할 수 있을만큼 중요해지고 있다.
투자를 'given'된 것으로만 생각한다. 주어진 것으로만 생각한다.
투자된 이후에 대한 매커니즘에 대한 것들은 많은 연구가 있는데, 그 이전에 대한 매커니즘에 대한 연구가 없다.
이 메커니즘을 밝혀내려고 하는 것이 이 페이퍼의 목적임.
신제도이론, 행태이론이 들어가면서 조금은 어려운 페이퍼.
 
 

이 페이퍼의 핵심이 이 표.
 - 자원을 할당하는 경우.
 
* IS Investment Decion-Making
 
기존연구의 문제
 1) Allocation 무관심
 2) 의사결정에 대한 기존 모델?
   - rational-agent model 여기에 가정하고 하더라. (인간이 합리모형에 기반하여 의사결정을 진행하더라.) 인간은 모든 대안을 예상할 수 있고, 모든 편익을 계산이 가능하며, 최적의 대안을 산출할 수 있는 능력을 가지고 있다고 가정하고 있음.
   -> 바늘 이론: 보통 바늘통에서 바늘을 찾을 때 대충 찾아서 씀.
   -> 인간의 선호체계는 시간이 지남에 따라 바뀐다.
대안이 무엇인가.
 

 
- 투자의사 결정자의 메커니즘을 밝혀냈다는 것이 의미
 
 
 
 
2015-05-28 사회과학 연구방법론 - 연세대학교 정보대학원 수업내용

-- 통계 시험 준비 --
 
경험적 연구(empirical research)는. 연구자가 직접 조사하여 어떠한 결과가 나오는 지를 직접 관찰하는 연구. 
 
 
-- 수업 --
 
조절변수 확인
 

 
그런데 조절 변수가 등간 척도로 구분되어 있음

 
csv 파일 2개 생성.
 
사후분석이라는 타이틀을달아서 요인분석 같은 분석 뒤에 사용하는 과정
이미 기각된 가설에 대해서는 사후분석을 할 필요가 없음.
 
* Chin's analysis
조절효과분석.
사실, chin의 논문을 읽어보면, 이 분석을 사용해서 유의미한 결과가 나온다면, 모든 가설에 대한 조절변수로서 작용한다고 할 수 있다. 하지만, 그렇게 되면 Review들에게 많은 공격을 받기 때문에 중요하게 생각하는 조절변수의 값만 영향을 미친다고 하는 것을 권장함.
 
- chin의 t값
해당 값을 계산할 수 있는 엑셀시트를 이용. (경로계수차이검정(Chin).xlsx )

 
# 관리 194명
 
PLS에서 t-value는 부스트랩핑 해서 경로 위에 써있는 숫자.

 
경로계수값 Path coefficient

 
Total Effects (Mean, STDEV, T-Values)
 
Original Sample (O)
Sample Mean (M)
Standard Deviation (STDEV)
Standard Error (STERR)
Privacy Concern -> Privacy Stress
0.412694
0.412377
0.051459
0.051459
Workload -> Privacy Stress
0.475487
0.477201
0.049735
0.049735
 
 
T Statistics (|O/STERR|)
Privacy Concern -> Privacy Stress
8.019889
Workload -> Privacy Stress
9.560490
 
 
# 테크 164명
 
t-value

 
경로계수값 Path coefficient

 
Total Effects (Mean, STDEV, T-Values)
 
Original Sample (O)
Sample Mean (M)
Standard Deviation (STDEV)
Standard Error (STERR)
Privacy Concern -> Privacy Stress
0.344454
0.343613
0.072272
0.072272
Workload -> Privacy Stress
0.516408
0.519274
0.063252
0.063252
 
 
T Statistics (|O/STERR|)
Privacy Concern -> Privacy Stress
4.766060
Workload -> Privacy Stress
8.164269
 
매개효과 분석 1

 

 
매개효과 분석 2
Sobel Test
 

 
 
2015-05-23 Seminar with JP Hahn - 연세대학교 정보대학원 수업내용

Stochastic 모델은 모든 것을 백지에서 시작함.
 
[HM12] Hahn, J. & Mukherjee, A. (2012). The Effectiveness of IT-Enabled Knowledge Management: Is
Knowledge Sharing Sufficient? Working Paper;
 
KMS 왜 실패 했는가. 시스템 구축에만 신경썼었다.
 
[G02] Sticky Aspirations: Organizational Time Perspective and Competitiveness
해보니 좋았다.
좋고 나쁜 것을 결정 짓는 것은 aspiration level
 
----
 
the basic NK model
 
중요한 의사결정의 선택과정
NK 툴은 산맥을 만드는 과정임.

 
---
비즈니스도 아는 IT 프로그래머
IT도 아는 관리자.
 - 단순한 프로젝트의 경우 서로가 서로의 영역을 모르는 게 프로젝트가 빨리 끝남.           
 - 복잡한 프로젝트의 경우 서로가 서로의 영역을 아는 게 프로젝트 Quality가 좋음. (Overlap이 있는게 좋다. )
 - 다만, 서로의 영역을 안다고 하더라도 비대칭적으로 알고 있는 편이 효율이 더 좋다. IT를 더 많이 알고 있거나 비즈니스를 더 많이 알고 있어야 프로젝트가 잘 진행되는 것.
 
Active CEO :
Rubber stamping CEO :
 
현상이 있으면 거기에 맞추면 되는 것.
run = 실험자.
데이터는 많이 나오는데, 해석을 하는 방식이 중요함.
 
NK는 생물학 - 기업이 혁신
CA는 컴퓨터 - 수용.
Stoch  - 아무 프레임 워크
Genetic
System
 

+ Recent posts