2015-06-11 사회과학 연구 방법론

 
시험 1시간 통계 시험 이 후, 2시간 동안 진행
범위는 서베이 리서치 이 후 (+실러버스를 참조하여 교과서 Page 매칭) 
강의한 내용에서 주로 문제가 나온다.
통계의 비율은 20%
 
--- 강의 총정리 ---
 
연구주제. 흥미로워야하고 컨트리뷰션이 있어야 한다. 이미 너무나 당연시 여겨지는 질문은 연구주제가 될 수 없겠음. 답하기 너무 힘든 애매모호한 경우도 바꿔야 할 것임.
 
질문
-> 질적 : 사례연구 (케이스 스터디), 관찰연구, 등등
-> 양적 : 실험. 시뮬레이션. 필드 스터디.
 
1) Sampling 에 대한 고민.
대상이 누구인지, 어떤 방법으로 수집할 것인지.
2) 데이터 컬렉션 방식. ex) 서베이(실험을 하면서도 서베이를 할 수 있을 것임). 인터뷰. 관찰. Secondary data 활용. 이미 모아진 데이터. 통계라던지. 트래픽 로그 같은거.
3) 모은 데이터를 어떻게 분석해야할 지. Statistic. 3가지 유형의 통계. 기술적인 통계. 타당성/신뢰도. 가설검증. ex) SPSS, PLS
 
유사한 논문을 찾아서 진행하면 석사수준에서는 괜찮음.
문헌연구를 찾아 볼 때도 관심 분야의 탑저널부터 거기에 나온 아티클에서부터 시작해야 함.
제일 좋은 학위 논문 - 제일 적은 노력으로 제시간안에 끝내는 논문.
 
주심 교수님 - 보통 같은 Author로 들어감. 졸업시키기 위한 변호사.
부심 교수님 - 보조역할. 검사의 역할. 부심이 사인 안해도 졸업을 못함. 예심때까지 논문에 대해 뭐라고 이야기를 안하면 상당히 괴로울 것임. 일단 한 번 찾아가고 피드백을 받고, 예심때는 반영시켜야함.
 
적어도 예심에서는 파일럿 테스트 결과는 나와야 함. Measurement가 잘못되었다고 교수가 지적하면, 해당하는 내용을 논리적으로 디펜스 할 수 있어야 함.
종속변수를 빼고 돌린 이유를 설명할 수 있어야 함.
 
전형적인 Bottom up 리서치이다.

다음주 클래스 총정리 + 개인연구프로포절 피드백 받는 시간
(개인 프로포절 -> 학기말 시험 제출일로 연기)
15 발표 + 5 Q&A
 
시사점과 공헌점?
 
공헌에 대해 이야기 해야 . ( 논문을 처음 서론에서 ) Marco
 - 보다 높은 레벨에서의 가치. 남들이 관심을 가지지 않았던 부분. 처음 연구된 부분.
시사점은 발견한 인과관계. (실무적으로. 이걸 가지고 있는지.) Micro
 - 구체적으로 결과를 활용하여 어떻게 했는지.
 
 문헌연구하기 전에 생각을 해봐야 한다. 생각을 기준으로 문헌연구를 진행해야 것임. (브레인 스토밍을 진행)
 책에 나온 Measurement 경우에는 통계적으로 검증이 안된 경우가 많다.  
 
차후 테스트(차이 테스트) 인과 관계 상의 테스트.
moderator mediator
해당 연구 방법론을 차용해온 곳에서 사용한 방법을 활용하면
 
변수를 측정하는 것과 변수의 인과관계를 물어보면 안된다.
 - 가능한 질문: 공부하는 시간 측정, 성적 측정.
 - 불가능한 질문: 공부를 열심히 하면 성적이 오릅니까?/오를 같습니까?
2개의 모형을 하나의 모형으로 했다. overlap 되거나 상충되는 것만 없더라도 상관은 없음. 선별적으로 골라서 넣어도 된다.
 
* 공통점
연구가 중요한지에 대한 Saling 되어야 한다.
발표하면 아이컨택해야해요.
독립변수 종속변수 넣어야 .
 

 
 
2016-03-17 Business Models - 연세대학교 정보대학원 수업내용

과제 가이드 라인.
 - Case Overview
 - 비즈니스 모델 분석
 - 개선방안 제안 (Technical 측면에서)
 

비즈니스 모델 캔버스는 flow를 나타내지 못하고 detail이 모자라는데, flow chart가 보완해줌.
 

* 비즈니스 모델을 볼 때 중점적으로 볼 3가지
어떻게 돈을 벌 것인가. Revenue Generation
타겟 커스터머 Target Customer
커스터머 밸류 Customer Value (Product or service)

불편한 점이 뭔지 부터 물을 수 있음. 이걸 먼저 물어야 함.
 
 
 

 

 

 

 

CSF4의 경우 낮은 가격 전략을 선택할 시, 메인 이슈로 취급되지는 않음. (저가 정책이냐 차별화 정책이냐)
20년전에는 이 전략들이 동시에 사용되면 안된다고 함.
이제는 충분히 할 수 있음. Technology를 활용해서. 고객 서비스를 향상시킬 수 있게 되었음. 두 가지를 동시에 적용하는게 추세임. 특히 우리나라 같은 경우에, 중국산 저가, 미국의 차별화 상품에 밀려 두 가지를 동시에 추구하고 있음.
 

자동차는 대표적인 Product -> 그런데 리스서비스.
미쉘린 타이어 회사. 관광버스의 타이어 관리 서비스 제공.
정수기.
 
직접 제품을 팔 것인가. 서비스를 팔 것인가. (정수기/프린트 렌탈/ 등등)
GE가 회사의 비전을 바꿈. Product 중심으로는 경쟁이 너무 힘들다.
 

 

플랫폼 비즈니스 이야기가 꼭 나옴.
멀티 사이드 플랫폼에서 가장 중요한 건 네트워크 이펙트. 고객들이 더 많이 늘어나야 사람들이 쓰겠죠.

 

 

항상 시작은 마켓분석. 다음에는 우리회사가 무엇을 할 수 있는지. 우리가 제안할 수 있는 커스터머 밸류가 무엇인지.

 

  1. 경쟁사분석
  2. 대체품
  3. 고객
  4. 공급자
  5. 새로운 진입자. Ex) 카카오. 네이버 등
 

Culture factors를 고려하는게 상당히 중요한 이슈. 중국은 꽌시 중요. 인도네시아는 고위층과 친한 뒤에 비즈니스 이야기 해야.
Government policies
Economic factors
 - 인도네시아: 천연자원 많으나 인종적 특징이 낙천적. (슬로우 워크)
 - 말레이시아: 낙천적 특징. (슬로우 워크)
 - 태국: 중간정도
 - 베트남: 가장 열심히 공부하려는 나라. 새마을 운동 같은
 

 

 

SW - 내부
OT - 외부

 

프로덕트 first < Customer first
 

니치로 시작해서 Expand
 

고객 불편으로 부터 Value Proposition을 할 수 있다.
 

# 커스터머 밸류. 4가지.
  1. 낮은 가격
  2. 내가 원하는 것: 비교 대상이 없음. 뭐든지 내게 제공되는 가치.
  3. 가격 대비 퀄리티
  4. 내가 쓰는 것 대비 내가 얻는 것. (단순 가격 뿐만 아니라 시간, 유용성 등을 포함)

 
1 Value
2 Value
Value Types
 - Functional Value
 - Emotional Value
 - Social Value
 - Epistemic Value : 새로운 지식
 - Conditional Value
Net Assessment (Benefit - Cost)
 

Hedonic value (향략적 가치)
 

현대차에서 에쿠스를 사장들이 타는 차라는 인식을 주기 위해서 사장 승급자들에게 에쿠스 지급을 독려하기 위해 영업작업을 엄청나게 한다고 함. 사장급. 대표급이 타는 차라는 이미지를 만들고 싶어함.
 

Social Image를 위해 삼. 

고객의 경험 사이클.

 
고객 구매경험 니즈에 따른 서비스 도출
상품인지 -> 상품 탐색/비교 -> 고객 경험 -> 구매/결제 -> 고객 사후 관리
 

 
 
 
 
 
 
 
 
 
 
2016-04-12 정량적 데이터 분석 - 연세대학교 정보대학원 수업내용

그룹간 비교는 PLS에서 다룸

 

여기에서 X와 Z간에 Causality가 없어야함.

 

x와 z간에 서로간에 Causal 관계가 있으면 안됨.
x와 z가 만나는 지점 x*z는 멀리콜리티니의 위험이 있기 때문에 정규화 시켜 작업진행 (평균이 0 분산이 1인 정규분포로 변경)

 
 
  1. 수정된 R제곱값을 확인.

 
  1. f값 계산

  1. f분포도에서 기준값 확인
 

4741 24591 2.4453 2.4324 24205 23359 22541 2.1750 20986 7 23677 19.353 8.8867 6.0942 4.8759 4.2067 3.7870 3.5005 32927 30123 29134 2*321 2.7642 2.7066 26572 2.0143 2.5767 2.5140 2.4876 2,4638 2.4422 2.4226 2 ,4047 23883 2.3732 23593 23463 2.3343 22490 2.1665 20868 20096 8 238.88 19.371 8.8452 6.0410 4.8183 4.1468 3.7257 3.4381 3.2296 3.0717 2,94S0 2.8486 2.7669 2��987 26408 2S91 1 2S480 25102 2.4708 2N471 2.4205 2.3965 23748 23551 23371 2.3205 23053 22913 22783 22662 2.1802 20970 1.9384 9 240.54 19.385 0123 '/>
비교해서 유의할 때의 R제곱값을 확인할 것.

 

 

 

 

Moderating Test 할 때, 표를 통해서는 유의한 차이가 있는지 없는지 알려줄 수 있고, 그래프를 통해 해당 차이의 경향성을 말해줄 수 있음.

 

 

 

A, b, c, c' 다 돌려서 유의해야 Mediation이 있는 것이라 할 수 있음.
 

 

Fully일수록 매개변수의 영향력이 더 중요하다고는 말할 수 있을 것임.
위 경우 Partially Mediated 관계이기 때문에 Discussion에서, Usefulness -> Intention 라인을 추가해서 이런 관계도 제안할 수 있다고 할 수 있음.

 

지금까지 한 것은 Baron and Kennv 방법
 
여기에 비평을 하기 시작함. 그래서 Sobel Test가 나옴.

Sobel Test에서 z값 구할 때는 표준화되지 않은 계수 경로를 활용. (비표준화 계수 활용)

 

z값 = Test statistic (웹사이트 참조)
 

하나의 테이블에 2가지 테스트를 할 수 있음. Assignment 2에서는 이 표를 그려야함.

세번째 테스트. Sobel Test의 문제점. Normal Distribution 가정이 있음. 샘플사이즈가 작으면 Normal Distribution이 아닐 경우가 많죠. 그래서 Bootstrapping Test

Bootstrapping Test가 Sobel Test보다 샘플 사이즈에 제약이 걸리는 경우가 적어서 더 파워풀함.

 

 

 
설치한거 PROCESS macro 임
 

 
# 과제 : 1차 제출과제에서 했던거 그대로 해야함.
 
 
 
 
 
2016-04-11 빅데이터 분석 기법의 이해와 활용 - 연세대학교 정보대학원 수업내용

박스플롯 해석방법

 

 
선형 회귀.
RMSE -> 추천선호도
 
R제곱은 독립변수가 값이 커지는 성질이 있음. 수정된 R제곱은 이걸 보정해주는 것.

 

종속변수가 counting이면 푸아송 알고리즘.
 
데이터 탐색
 -> 분류하는 문제.
결측값을 해당 컬럼의 중앙값이나 평균값으로 대체해서 계산할 수도 있음. 가장 가까운 이웃 K개의 값까지의 거리를 고려한 가중 평균치로 대체가능.
 
KNN vs 콜라보레이티브 필터링 차이 (Collaborative filtering)
Collaborative filtering이 알고리즘 피어슨 상관계수 사용하긴함. KNN의 일종이라고 볼 수 있음.
하지만 조금 다른 방식으로 계산
 

 
정밀도 Precision: True라고 말한 것 중에 정말 True인 비율
재현율 Recall : 실제 T인 것들 중에 예측도 T인 비율 -> 이걸 높이려면 다 T라고 하면 된다. 그렇게 되면 정밀도가 떨어짐.
 
SPSS에서도 코딩해서 짤 수 있는 기능이 있음. 그 기능을 활용해서 R코드를 불러와서 활용할 수도 있음. 하지만 그냥 R쓰면 됨. 반면 SAS는 R과 담을 쌓고 있음. SAS에 있는 기능이면 그걸 쓰면 된다. 그게 제일 좋긴함. (기능이 존재한다면 SAS를 쓰길! 미국 평균 연봉도 SAS가 높음)
 
공공데이터를 공개한걸 가지고 앱을 만들거나 사업을 하는 사람들이 있음.
실제 사업하는 사람들은 어떤 데이터로 하는지.
 
10000개 이하로 가지고 있는 경우에 돌릴 수 있음.
 
R에 Recommender lab이라는 패키지가 있음. Collaborative filtering 이라는 알고리즘 있음.
<R을 활용한 추천시스템> 임일 연세대 경영대 교수님
 
크롤링 하려고 하는데, 클래스 이름이 명확하지 않으면 xpath를 사용해서 해결할 수 있는데, 내용이 좀 어려움.
 
 
 

+ Recent posts