2015-05-30 [통계] PLS 상세 설명 버전
본 글에서는 PLS(Partial Least Square) 분석을 위한 소프트웨어 중 하나인 SmartPLS를 소개하고 사용법을 설명하고자 한다.
현재 PLS-Graph, VisualPLS 등의 다양한 PLS 소프트웨어가 나와있고, 본 저자도 이러한 소프트웨어들을 모두 사용해 봤지만, 분석의 용이성, 소프트웨어의 안정성, 분석 결과물의 품질 등에서 가장 맘에 드는 소프트웨어이다.
본 글은 다음과 같이 구성된다.
Written by Jinwon Hong(홍진원)
Last Updated: 2008-08-30
1. SmartPLS 소개
SmartPLS는 독일의 Hamburg 대학의 Ringle, Christian Marc/Wende, Sven/Will, Alexander 등에 의해 개발된 PLS 분석을 위한 무료 소프트웨어이며, 현재 2.0 M3 버전까지 개발되어 있다.
아래 URL로 웹사이트를 방문하고 사용자 등록을 하면 무료로 사용할 수 있다.
이 웹사이트에서는 SmartPLS 및 PLS 분석과 관련된 다양한 정보를 획득할 수 있는 커뮤니티도 운영하고 있어 PLS 분석 중 생기는 다양한 문제들을 해결하는 데 도움을 얻을 수 있다.
소프트웨어 설치 시 특별히 시스템 사양을 가리지는 않지만, Java 2 Standard-Edition Runtime Environment (J2SE JRE) 5.0 이상이 설치되어 있어야 SmartPLS를 실행시킬 수 있으며, 아래 주소에서 다운로드 받을 수 있다.
Written by Jinwon Hong(홍진원)
Last Updated: 2008-08-30
2. 데이터 셋의 준비
우선 SmartaPLS를 실행시키기 전에 분석의 대상이 되는 데이터 셋을 준비해야 할 것이다.
SmartPLS는 csv 파일 포맷을 지원한다. csv 파일은 엑셀이나 SPSS 등에서 “다른 이름으로 대상 저장”을 선택하고, 파일 포맷에서*.csv를 선택해주면 쉽게 생성할 수 있다.
Written by Jinwon Hong(홍진원)
Last Updated: 2008-08-30
3. 실행 및 프로젝트 생성하기
SmartPLS를 처음 실행시키면 아래와 같은 대화상자가 나타나며, Browse 버튼을 눌러 PLS 분석을수행하는 데 사용할 폴더를 지정해주고, OK 버튼을 누르면 된다.
그러면 아래와 같이 첫 화면이 뜰 것이다.
위 화면은 SmartPLS의 기본적인 사용법을 설명하고 있다. 일단 현재 상태에서는 큰 도움이 안되므로, Welcome 탭에 있는 X 버튼을 눌러 창을 닫는다. 그러면 아래와 같은 화면이 나타날 것이다.
위 화면을 보면, 좌측에 Project, Outline, Indicators 탭이 보일 것이다. 각각의 역할은 다음과 같다.
Project: SmartPLS를 이용해 분석중인 프로젝트들을 보여줌. 여러 개의 프로젝트들을 생성할 수 있으며, 각각의 프로젝트에는 PLS모형과 데이터가 할당된다.
Outline: PLS 모형에서 사용중인 잠재변수(latent variable, 구조방정식에서는 개념(construct)라고도 함)들과 각각의 잠재변수에 할당되어 있는 indicator들의 목록을 보여준다.
Indicators: 데이터 셋에 들어있는 indicator들의 전체 리스트를 보여준다.
새로운 프로젝트를 생성하기 위해 Project 탭을 클릭해주고 마우스 오른쪽 버튼을 누른다. 그러면 아래 그림과 같이 메뉴가 나타나며, Create New Project를 클릭해주면 된다.
아래와 같은 대화상자가 나타나면 Project name에 프로젝트 명을 기입하고 Next를 클릭한다. Import indicator data가 기본으로 체크되어 있는데, 이 기능이 체크되어 있으면 프로젝트를 생성하면서 데이터 셋도 함께 불러오게 된다.
아래 대화상자가 나타나면 미리 만들어놓은 데이터 셋을 불러오고, Finish 버튼을 클릭한다.
아래와 같이 새로운 프로젝트가 생성되었다. 모델탐색.splsm은 PLS 모형과 관련된 파일이고, Raw Data.csv는 데이터 셋이다. 새로운 모델을 그리기 위해서 모델탐색.splsm을 더블클릭 해준다.
그럼 아래와 같이 화면이 바뀔 것이다. Indicators 탭에 데이터 셋에 들어있는 변수들이 자동적으로 할당되고, 모델탐색.splsm이 작업가능한 상태로 활성화 된다. 이 상태가 되면 PLS 모형을 그리고 분석을 수행할 수 있게 된다.
Written by Jinwon Hong(홍진원)
Last Updated: 2008-08-30
4. 모형 그리기
모형을 그릴 때에는 아래의 3가지 아이콘이 사용된다. 좌측부터 차례대로 설명하면 다음과 같다.
화살표 아이콘: 가장 좌측에 있는 아이콘을 클릭하면 모형내의 잠재변수나 경로들을 선택할 수 있다. 이를 통해 잠재변수들의 위치를 변경하거나, 잠재변수와 관련된 각종 옵션들을 사용할 수 있다.
잠재변수 아이콘: 중앙에 있는 아이콘을 클릭하면 잠재변수를 그릴 수 있다. 이 아이콘을 한번 클릭하면 계속 잠재변수를 그리는 상태로 고정되므로, 잠재변수들을 다 그리고 난 후에는 가장 좌측에 있는 화살표 모양 아이콘을 꼭 클릭해줘야 한다.
경로 아이콘: 가장 우측에 있는 아이콘을 클릭하면 잠재변수간의 경로를 그릴 수 있다. 이 아이콘도 한번 클릭하면 계속 경로를 그리는 상태로 고정되므로, 잠재변수들을 다 그리고 난 후에는 가장 좌측에 있는 화살표 모양 아이콘을 꼭 클릭해줘야 한다.
그럼 지금부터 모형을 그려보겠다. 분석하려는 모형은 인지된 즐거움(PE), 인지된 사용편의성(PE), 인지된 유용성(PU), 지속적 사용의도(CUI) 등의 4가지 잠재변수로 구성된 모형이다.
잠재변수 아이콘을 선택하고, 모델탐색.splsm 창의 원하는 위치에 마우스를 포인터를 가져간 후, 마우스 왼쪽 버튼을 누르면 잠재변수가 그려진다. 이러한 방식으로 아래 그림과 같이 4개의 잠재변수를 그린 후, 화살표 아이콘을 클릭해준다.
잠재변수를 다 그렸으면 경로 아이콘을 클릭한다. 경로를 그릴 때에는 경로가 시작하는 잠재변수를 마우스로 클릭한 후, 경로가 끝나는 잠재변수를 다시 마우스로 클릭해주면 된다. 이러한 방식으로 아래 그림과 같이 경로들을 그린 후, 화살표 아이콘을 클릭해준다.
이제는 각각의 잠재변수에 대해 잠재변수명을 부여해보도록 하겠다.
화살표 아이콘이 선택되어 있는 상태에서 가장 상단의 좌측에 있는 잠재변수를 클릭하고, 마우스 오른쪽 버튼을 누르면 아래와 같이 메뉴가 나타날 것이다.
위 메뉴 중 중요한 것들만 설명하면 다음과 같다.
Delete: 선택한 잠재변수 또는 경로를 삭제한다.
Rename Object: 잠재변수의 이름을 지정 또는 수정한다.
Hide/Show measurement model: 잠재변수에 할당된 indicator들을 보여주거나 숨긴다.
Invert measurement model: 잠재변수에 할당된 indicator들을 반영지표(reflective indicator)에서 조형지도(formative indicator)로,또는 조형지표에서 반영지표로 바꿀 때 사용한다.
Rename Object를 선택하면 아래와 같은 대화상자가 나타난다. 잠재변수명을 입력하고 OK 버튼을 클릭한다. 이러한 방식으로 나머지 잠재변수들에도 아래 그림과 같이 잠재변수명을 입력해준다.
여기까지 그렸으면 각각의 잠재변수들에 대해 indicator들을 할당할 차례이다.
좌측의 indicator 탭에서 PE1-PE4를 PE에 할당하기를 원한다면, PE1-PE4를 마우스 왼쪽 버튼으로 클릭한 상태로 PE 잠재변수 위로 끌어온 후 마우스 버튼을 놓으면 변수가 할당된다. 이러한 할당은 다음과 같은 방법으로 이루어질 수 있다.
첫째, PE1-PE4를 하나하나 끌어오는 방법. 가장 무식하고 노가다적인 방법이라고 할 수 있다.
둘째, Shift 버튼을 누른 상태에서 PE1을 클릭하고 PE4를 클릭하면 PE1-PE4가 모두 선택된다. 이 상태에서 선택된 indicator들을 마우스 왼쪽 버튼으로 클릭하고 잠재변수로 끌고 온다. 이 방법은 indicator들이 서로 붙어있는 상태로 배열된 경우에 편리하다.
셋째, Ctrl 버튼을 누른 상태에서 원하는 indicator들을 마우슨 왼쪽 버튼으로 클릭한 후, 마우스 왼쪽 버튼으로 클릭하고 잠재변수로 끌고 온다. 이 방법은 indicator들이 뛰엄뛰엄 배치된 경우에 편리하다.
PE1-PE4 indicator를 PE 잠재변수에 아래와 같이 할당한다.
잠재변수에 indicator가 할당되면 화면이 다음과 같이 변한다. PE1-PE4 indicator들이 PE 잠재변수에 반영지표로서 할당되어 있는 것을 알 수 있다. 이때 만약 조형지표로 할당하고 싶으면, PE 잠재변수를 클릭하고, 마우스 오른쪽 버튼을 누르면 나타나는 메뉴에서 Invert measurement model를 클릭해준다.
위와 같은 방식으로 나머지 변수들에도 아래 그림과 같이 indicator들을 할당해준다.
현재 indicator, 경로, 잠재변수가 서로 섞여있어 매우 보기 좋지 않다. 모형 그리기 아이콘들 중 화살표 아이콘을 클릭하고, indicator을 선택하고 drag & drop해서 아래 그림과 같이 개인 취향에 따라 보기 좋게 모형을 배치해준다. 이 상태가 되면 모형 그리기는 끝난 것이며, 본격적으로 분석을 수행할 수 있게된다.
Written by Jinwon Hong(홍진원)
Last Updated: 2008-08-30
5. PLS 분석 수행하기
PLS 분석은 아래 아이콘들을 이용해 이루어진다. 일반적인 논문의 경우 PLS Algorithm과 Bootstrapping을 이용해 대부분의 분석을 수행할 수 있다.
우선 PLS Algorithm 아이콘을 클릭해주면 아래와 같은 대화상자가 나타난다. 일반적인 경우 특별히 설정을 바꾸지 않고 바로Finish 버튼을 눌러주면 된다.
아래 그림은 PLS Algorithm 분석 결과를 보여주고 있다. 잠재변수 내의 숫자는 R Square 값을, 잠재변수간의 경로 위의 숫자는 잠재변수간의 상관계수를, 잠재변수에서 indicator로 향하는 경로 위의 숫자는 Outer Loading 값을 나타낸다.
상세한 분석 결과를 보기 위해서는 아래 아이콘들을 사용하면 된다 Html Report는 웹 브라우저를 통해 분석결과를 보여주면, Default Report는 SmartPLS 소프트웨어 내에서 새로운 창으로 분석 결과를 보여준다.
Html Report를 클릭하면 다음과 같이 브라우저에 나타난다. 컨텐츠에서 원하는 항목을 클릭하면 바로 이동이 가능하다. 여기에서Latent Variable Correlations를 클릭해보자.
아래와 같은 형식으로 분석 결과가 나타난다. Internet Explorer를 사용하는 경우 특정 표를 마우스로 클릭하고 마우스 오른쪽 버튼을 누르면 나오는 메뉴에서 “Microsoft Excel로 내보내기”를 누르면 특정 표를 Excel로 내보내서 분석할 수도 있다. 아래 항목들에 대한 자세한 설명은 본 글의 범위를 벗어나므로 따로 설명하지는 않겠으며, 블로그 내의 다른 PLS 관련 글들을 참조하기 바란다.
Written by Jinwon Hong(홍진원)
Last Updated: 2008-08-30
6. 가설 검정 수행하기
PLS 분석을 통해서 잠재변수들간의 관계의 정도와 독립변수들이 종속변수들을 얼마나 설명할 수 있는지를 살펴볼 수 있었다. 그러나 잠재변수들간의 관계(즉, 연구가설)가 꼭 통계적으로 유의한 것은 아니다. 즉 가설의 채택 또는 기각을 결정할 필요가 있는 것이다. SmartPLS의 경우 아래 그림의 Bootstrapping을 이용해 가설 검정을 수행한다.
우선 Bootstrapping 아이콘을 클릭해주면 아래와 같은 대화상자가 나타난다. Cases에는 데이터 셋에 포함되어 있는 표본의 수를 입력해준다. 그리고 Samples에는 샘플링을 몇 번 수행할 것인지를 입력해 주는데, 일반적으로 500회가 많이 사용된다. 입력이 끝나면 Finish 버튼을 클릭한다.
그럼 대화상자 아래 부분에서 Bootstrapping 진행상태가 보여진 후, 화면에 분석 결과가 아래 그림과 같이 나타날 것이다. 아래 결과를 보면 PEOU->CUI는 기각되었으며, 나머지 가설들은 p=0.01수준에서 모두 채택되었음을 알 수 있다.
가설 검정의 기준은 아래와 같다.
t 값의 절대치
|
양측 검정
|
단측 검정 |
t>3.30
t>2.58
|
0.001에서 유의
0.01에서 유의
|
0.0005에서 유의
0.005에서 유의
|
t>2.33 |
0.02에서 유의
|
0.01에서 유의
|
t>1.96 |
0.05에서 유의
|
0.025에서 유의
|
t>1.645 |
0.10에서 유의
|
0.05에서 유의
|
상세한 분석 결과를 보는 방법은 앞에서 설명한 것과 같다.
Html Report를 클릭하면 다음과 같이 브라우저에 나타난다. 컨텐츠에서 원하는 항목을 클릭하면 바로 이동이 가능하다. 여기에서Path Coefficients (Mean, STDEV, T-Values)를 클릭해보자.
Path Coefficients (Mean, STDEV, T-Values)를 클릭해 이동하면 다음과 같은 분석 결과가 나타날 것이다. 여기서 T Statistics 값을 이용해 가설 기각, 채택 여부를 결정하게 된다.
지금까지 SmartPLS의 사용법을 간략하게 살펴봤다. 한가지 유념할 것은 SmartPLS는 PLS 분석을 위한 도구일 뿐이라는 점이다. PLS와 관련된 이론들이 뒷받침되지 못하다면, 위의 분석 결과물들은 아무 의미 없는 숫자놀음이 될 것이다. PLS 관련 이론들은 본 블로그 내의 다른 글들을 참고하기 바란다.
Written by Jinwon Hong(홍진원)
Last Updated: 2012-03-07
'Data Science 데이터 과학' 카테고리의 다른 글
구조방정식 모델적합도(Model-Fit) 평가지수 해석 (0) | 2018.02.24 |
---|---|
비즈니스 혁신의 근원으로서의 분석 Analytics as a Source of Business Innovation (0) | 2018.02.20 |
2015-05-07 사회과학 연구방법론 - 연세대학교 정보대학원 수업내용 (0) | 2018.02.19 |
2014-11-25 [Linux] <시작하세요 하둡 프로그래밍> Hadoop 설치 가이드 1 (0) | 2018.02.19 |
빅데이터 분석을 통한 조혈모세포 기증에 대한 대중 인식과 실제 (1) | 2018.02.19 |