2016-03-22 정량적 데이터 분석 - 연세대학교 정보대학원 수업내용

 
가장 안좋은 접근 방식이 서두에 기존의 정보 시스템 관련 연구중에 이 연구가 되어 있지 않았다. 라는 부분이 가장 안좋은 접근임. 이론을 위한 이론이라는 측면을 이야기 하고 있는 것임. 결국 이 연구가 안되었기 때문만이 아니라 흥미에서 부터 연구가 시작되어야 할 것임. 선택한 Theory가 왜 필요하다고 했지.
 
Theoretical Framework가 왜 필요할까요.
하나의 집(model)을 만들기 위한 설계도에요. 하나의 체계. 바로 Research Model로 넘어갈 수도 있어요. 하지만, 그 대신 많이 길어져야겠죠. 설계도. 체계를 만들어야 한다는 것이죠.
 
종속변수를 가져오는 방안. 일단 문헌에서 그것만 빼오지 말고, Background theory를 이용해서 가져와야함.
 
매핑이 안되면 어떻게 해야할 것인가?
 

기본적으로 논문은 이 흐름을 따라가면 되는 것.

Introduction을 잘써야함. 궁극적으로 목표는 왜 이 연구가 중요하고 반드시 해야하는 토픽이라고 설명을 해야함. 실무자들을 위한 연구. 이걸 먼저 포인트를 주고 갈 것. 연구를 위한 연구가 아니라 실무를 위한 토픽이 무엇일 것인지 염두해둘 것.

Theory가 관점viewpoint

 
1. 선행연구가 얼마나 이루어졌고, 얼마나 중요한지.
2. 프레임 워크나 이론적 배경에 어떻게 활용할 것인지에 대한 것.
처음했다는 이야기는 하지 않는게 좋음. 기존 연구와 얼마나 다른지를 강조하는 것이 좋음. 문헌연구를 제대로 하지 않았다는 게 되는 것이 되므로.

아주 전형적인 단순한 표

표를 잘 만드는게 좋음.
기존의 단순한 표가 아니라 한 단계 더 나가서 어떻게 할 것인지가 중요할 것.

협의의 Theory : 이미 검증되고 많이 사용된 이론.
광의의 Theory : 검증된 가설들의 집합체. Set of propositions

 

이 연구에서 진행하는 것은 Variance Theory.
 

 

 

리서치 모델을 만들 때, 항상 프레임워크를 만들려고 노력해보세요.
 

사람들이 왜 디지털 아이템을 구매할까. 여기에 대한 이론.
이론적 프레임워크 : 1.전체적인 큰 구조를 보여주는 것 2.특정 변수 도출에 관한 것. Factor 추출.

 

서베이 하나만 사용할 수도 있지만, 다른 방식도 활용할 수 있음.

문헌조사말고 진짜 한 번 탐색을 하는거임. 인터뷰를 하는 것임. 직원들에게 직접. 인터뷰를 통해 팩터들을 끄집어 낼 수 있음.
 

 
Background Theory
인터뷰를 통해 팩터를 도출하고 그걸 검증.

아무런 백그라운드 이론없이 일단 인터뷰.

리서치 모델의 팩터로 사용. 그룹핑 작업만 하고 거기에 이름을 붙였음.

다섯가지의 팩터가 어떤 이론적 연관성을 지니는가. Theritical Implication 작업이 필요. 이론과 응답자들간의 매핑 작업이 필요.

인터뷰한 내용이 이론적으로 완전히 매핑될 수 없을 수는 있다. 그렇다고 해서 억지로 남아있는 payment를 변수로 넣을 필요는 없음.
 

일반적인 이론과 일반적인 문헌 연구에 언급된 부분과 매칭이 안되고 남은 변수가 있으면 context_unique한 문헌 연구에서 가져와서 매핑 시킬 수도 있음.
 
 
샘플링 단위. 5명 단위. 25명까지 했는데, 새로운 코딩이 나왔다면 5명 더 진행. 30명까지 했는데 새로운 코딩에 관한 이야기가 안나왔으면 진행하지 않아도 됌.
 
 

Social Excahnge Theory로 접근함.
처음부터 이론에서 시작. 앞에할 것이냐 뒤에 할 것이냐의 차이.
 

 
Net value는 인터뷰 내용과 상관없이 Propose 할 수 있음. 시작이 이론에서 부터 시작되었기 때문임.
 
Mixed-method 장점: survey research 단점이 thoery oriented 되기 때문에 놓치는 부분이 생길 수 있음. 고객들로 부터, 실제 대상자들에게서 들을 수 있는 detail을 놓칠 수 있음. Qualititive study도 함께 활용할 수 있음. 기존 연구가 많이 없는 경우에 좋음. 아무런 레퍼런스 없이 사용자나 고객으로부터 찾아내기에 용이함.
 

 
항상 강조하는 것이 Causal 관계가 성립해야 하는 것이에요.
원인과 결과의 관계를 잡은건지 프로세스 관계를 잡은건지 애매한 경우가 있어요.
귀저기 옆에 맥주는 코릴레이션 관계에요. Causal 관계가 아니라.

Survey 연구가 비판 받는 이유 1. 한 시점에 모든 데이터를 수집 2. 전부 perception만 가지고 데이터를 수집. Intention이 behavior로 가는가. (Objective Data 까지 가는가)

실제 구매가 어느정도 이루어졌나. Subjective data -> Objective data가 조화.

 
Perception 데이터만 가진다는 한계를 극복할 필요가 있음.
 

 

 

기존의 서베이 연구를 해결한 사례.
1. 자료 수집 시점을 여러 번 2. Objective data까지 수집할 것.
이런 상황을 하기 어렵겠다. 하면 mixed-method를 하는게 오히려 나을 것임.
 
첫번째 스테이지에서 대상으로 했던 응답자들을 두번째 스테이지에서 재설문 해야함. 그래서 중간에 이탈자가 많을 것임.
Q. 1차에서 200명 2차에서 100명 이면 통게 돌릴때 100명만 가지고 돌려야 하는건지. 최종적으로 남은 데이터만 가지고 돌려야함. 100명으로 돌려야함.
Q. 보통 2차 응답률이 몇 % 정도 되는지?
Stage 1과 Stage 2 사이 기간에 특정 이벤트가 발생해서 영향을 미쳤다면 그거에 대해서는 설명하기 어려움. 그 시기를 잘 피해야함.
 
Unit of Analysis
이 연구 모형에 있는 각각 변수의 Unit of Analysis 가 맞는지 잘 비교해 보아야함.
R스퀘어가 뭐지? 설명력. 간혹 R스퀘어 값을 100%로 맞추려고 하는 경우가 있음. 대상으로하는 현상으로 하여금 변수로 설명하는 것이 아카데믹 리서치. 100%에 맞추는게 목적이 아님. 절대 그렇지 않아요. 20% 이상만 되면 최소한 Acceptable 할 수 있어요. 리서치 모델이 복잡해 보여야 있어보인다? 그렇지 않음. 간결하면서 잘 이론을 제대로 설명하고 그것이 유니크하면 좋음. 하나의 연구로 모든걸 100% 설명하는 게 목적이 아님. Independent variable가 최소 몇 개? 3~4개 정도? 5개정도 나와도 좋은 곳에 퍼블리쉬 될 수 있어요.
 

나쁜 가설.
Usefulness 자체가 가치인데 이게 value에 영향을 미친다고 하는 것.
Two variables 가 Correlated 된 경우.

 

가설에 대한 설명. Literature driven 가설 설명을 하지 말고 Thoery driven 가설 설명을 하도록 할 것. 로직. 흐름으로 가설 설명을 할 것.
예)

 

Phenomenon ~ Research Methodology 까지가 가장 중요함.
 

ptual meme or the cc"��truct Denne the construct in unambiguous uyrms Considerations ucu? Litemture review of previous theoretical amd empirical r��earch on the twal oonstmct ucu? Reviem ct literature on the meaning of related constructs ucu? using matter actitzucu?ners Identify the type of propeucu?ty the construct represents, and the entity t.u?hich it ucu? Job satisfaction: Entty = person: general property = nsitiva feelings atnutt.# job ucu? End-user satisfacton: Entity = general property = positive feelings at:nout computer technology ucu? Perceived gage or use 01 techrwlogyu?. Entity person; prcperty perception or t:vlier about tlu:ucu? use of technoloqv ucu? IT capabilities: Entity u? organizatuo,n; general property - IT abilities and competencies ucu? P.��ural justi��: Ent'ty : : of fairn*" ucu? Role ambiguity: Entity = person: gelHaI propaty = clarity ot perception of role "u?quirements ucu? Fear of technological advar��es: Entity u? person; general property - fear of technological ucu? Job pgdormance: Entity = person; ganeral = job ucu? Firm pgrTcwnance: Entity u? organization general property - organizational outcnrnes ucu? Social capital: Entity = organization; general propeltv = rescuce3 accruu?rg trom network relationships Describe necessary and 3'.'ffcucu?ent attributes@harocteristics as narrcnoly as ucu? Cornmcu?n attributes'cmracteristic; ucu? Unique attributes/cnarectaristics ucu? Brg��dttvlnclusivgnass Dimensionality ucu? Unidimensional ucu? Multidimensional stability ucu? Over time ucu? Acvoss situations Acrog; cases Provide clear, concise conceptual derinition or the construct ucu? Should not be subject multiple interpretatons Mackenzie, S. B. , Podsa M. , Pdsakoff, N. P. , " measurement ard valid ptozedures in MIS and behavioral '/>
 
변수의 definition은 변수가 처음 언급되는 때에 하는 게 좋음. Theoretical Framework 단계에서 하는 게 좋음.
 
변수를 뭔가 새로운 걸 만들고 싶다. 2가지 체크해봐야함. Entity = person, General Property(일반적인 속성) 에 대해 다르다고 말할 수 있어야함. Single
Single dimension multi dimension
Fomative construct, Reflective construct
 

Operationalization: 어떻게 측정할 것인가. Objective data는 명확함. Subjective data는 survey question을 만들어야함.

지적능력. 학업능력.
복수개의 측정항목이 존재. 최소한 3개. 기본적으로 4개를 만들려고 하길.

 

 

 
일반적인 변수는 Reflective vs Formative
 

Reflective
 인간관계에 영향을 주는 여러가지 중에 몇가지를 측정.
Formative
 형성 더하기한다. 각각의 측정 항목을 더해서 평가. 영어능력은 듣기, 쓰기, 말하기로.

 
되도록 Reflective 쓰세요.

 

 
* Adopt 같은 변수의 경우, 같은 측정항목을 쓰는 것.
* Adapt 컨텍스트에 맞춰 수정하는 것.
가장 어려운 것은 새로 만드는 것.
 
응답자의 입장에서 문장에서 만들어야함.
하나의 측정항목에는 하나의 컨셉이 들어가야함.
 

+ Recent posts