2015-05-22 Deep dive Seminar with JP Hahn - 연세대학교 정보대학원 수업내용

시뮬레이션 설계 단계에서 프로그래머나 설계자의 선택이 들어가게 되기 때문에 선천적인 결점이 있는 것이 아닌가.
 
 
 
Deep Dive(Model part)
# HL14
The Complex Effects of Shared Domain Knowledge on IS Development: A Simulation-Based Theory Development
 3. A MODEL OF INFORMATION SYSTEMS DEVELOPMENT AS LANDSCAPE SEARCH
 -  NK fitness landscapes model (Kauffman 1993)
  -- . The NK fitness landscapes model is most appropriate when organizational adaptation can fundamentally be conceptualized as design problem solving (Davis et al. 2007);
NK 모델은 가장 적절한 모델이다. 조직적 수용이 근본적으로 개념화 될 수 있을 때 문제 해결에 있어서.
  3.1. The NK Fitness Landscapes Model
The NK fitness landscapes model is an analytical framework for studying adaptive behaviors (Kauffman 1993) NK 모델은 수용적 행동에 대한 분석적 프레임워크다.
the researcher must specify two primary modeling constructs – 1) the problem space, and 2) the agent’s behavioral rules for goal-directed adaptation. 반드시 2가지 모델링 구조를 구체화 해야한다. 1) 문제 공간 2) 에이전트의 행동 규칙들 목표 지향적인 수용을 위한. 
 
# HLH13
A Theoretical Framework for Requirements Research: A Complex Adaptive Systems Approach using the NK Fitness Landscapes Model
 3. THE NK FITNESS LANDSCAPES MODEL AS A THEORETICAL FRAMEWORK FOR STUDYING RE
In the NK fitness landscape model, an agent (e.g., an RE team) is conceptualized as operating in an environment or problem space involving N decision variables and K interdependencies among these decision variables. NK 피트니스 풍경 모델에서 에이전트는 개념화 된다 운영되는 환경 혹은 문제 공간으로 N 결정편수들과 K 상호의존성들 사이에서.

 
# HM12
The Effectiveness of IT-Enabled Knowledge Management: Is Knowledge Sharing Sufficient?
 3. A Computational Model of Organizational Knowledge Work
  3.1. Knowledge Work and Organizational Structure
  3.2. Individual’s Decision Making Process
  3.3. Choice of External Knowledge Source
  3.4. Organizational Decision Making Process
  3.5. Organizational Knowledge Culture
 
# MHOK14
LEADER INFLUENCE ON SUSTAINED PARTICIPATION IN ONLINE
COLLABORATIVE WORK COMMUNITIES: A SIMULATION-BASED APPROACH
 3. SIMULATION MODEL AND EXPERIMENTAL DESIGN
 3.1. Research Approach: Agent-Based Modeling and Simulations
analytical frameworks and tools from the complexity sciences (e.g., complex adaptive systems, fitness
landscapes, computational modeling, self-organization / stigmergic systems etc.) can be brought to bear
on a diverse set of complex organizational and management problems (Anderson et al. 1999). complexity sciences에서 유래한 분석적 프레임워크와 도구들은 복잡한 조직적 그리고 관리상의 문제들에 힘써왔다.

 

3.2. Modeling OCWCs’ Environmental Factors

# SH10
IMPACT OF ONLINE WORD-OF-MOUTH ON THE MARKET FOR CONSUMER GOODS –
THE INTERPLAY BETWEEN ADOPTION RATE, PRODUCT MARKET LIFE AND MARKET
SIZE

 - Modeling Consumer Adoption with Online Referral Networks
We use cellular automata (CA) as the simulation approach to study the impact of enlarged reach
of online referral networks on consumers’ adoption behaviors (Davis et al. 2007)
샐룰러 오토마타 기법은 적절하다 긴급한 매크로 레벨의 시스템 패턴을 연구하는 데에.
CA models are appropriate for studying the emergence of macro-level system patterns (e.g., diffusion, propagation, competition etc.) from micro-level interactions of spatially related semi-intelligent agents (Wolfram 2002)

 
# YH14
The Role of Project Modularity in Information Systems Development
 - A Model of ISD as Design Problem Solving
The model setup requires the specification of four features: (1) the representation of a project’s
performance (fitness) landscape; (2) the various modular design choices; (3) the process of the ISDM
applications; and (4) the process of adaptation on the landscape.
 - Modeling the Project’s Performance Landscape

The agents’ (ISD teams’) adaptive behaviors are modeled as incremental experiential search. For the agile
development process
 
2015-04-11 R 이용한 연관관계분석 기법

 
1부 - R을 이용한 연관관계분석 (김진화 교수)
 

 
 

 
2부 - 연관관계를 이용한 기술의 미래 예측  (김진화 교수)
 
노드엑셀.
퓨쳐스휠.
극성이 있다. (-)가 10%만 되어도 저지할 수 있는 가능성이 커진다.
때문에 바라바시 이론을 사용한다.
 
3부 - N/A의 빅데이터 활성화 지원소개(김성현 박사(수석))
 
크롤링을 대행하는 서비스를 운영할 예정이다. (민간에 공개할 예정임)
 
AI 사고 확산 방지를 위해 예측을 하기 시작했는데 공무원들이 실제로 그 내용을 받아들이지 않고 있다.
 -> 동물들을 옮기는 숙주차량을 발견하여 예측지도를 만들었고, 실제 발병 지역도 일치했음.
 -> 이 내용을 중앙일보가 보도하여 농림부가 지속적으로 받아들이지 않고 있음
 -> 천재지변이 아니라 예측가능한 인재
 
~~청 자료가 좋다. 트랜잭션이 많이 일어나기 때문에 (조달청, 중소기업청 등)
 
데이터 톤이 활성화 되고 있다.
 
 - 정부 3.0이 들어서면서 데이터를 활용하여 성과를 내고자 하는 경우가 많다.
인프라 > 교육실습
원격으로 인프라 신청을 할 수 있음.
하둡, 몽고DB, D3차트, R, 스크립트는 자바로 되어 있음. (무료로 제공)
다만, 파이썬은 깔아두지 않았다.
 
공공 데이터셋(교육용으로 분석을 허락한 비식별 데이터)
단점: 자유롭게 파일을 다운로드/업로드가 안된다. 데이터가 나가면 데이터를 주지 않는다고 함. 클로즈드된 시스템. 다음 분기에는 업로드까지는 지원예정.
초급(학부생) 중급(대학원생) 고급(교수님들)
 
빅데이터 전문가 양성 교재를  [교육/실습] 항목에 웹페이지 형식으로 다 정리해두었음.
 
강의자료 다운 URL
 
 
김진화
 
===== 2015-04-12  업데이트 =======
 
경영 빅데이터 분석사 1급
 
한경 인터넷 강의
 
 

❍ Reading Summary

본 보고서는 AI 연구에 대한 보고서로 인공지능연구, 개발 및 시스템 설계를 포함하여 프로그램 및 정책에 대한 지침을 제공하고 있다. AI에 대한 막연한 기대와 대중들의 잘못된 추측들을 바로잡고 하나의 가이드라인을 본 보고서를 통해 제시하여 AI에 대한 이해를 돕고 있다.

인공 지능 향상 협회 (AAAI)의 에릭 호빗 (Eric Horvitz) 회장을 중심으로 이루어진 100년 연구는 AI 분야의 사람들과 사회에 미치는 장기적인 영향을 추적하고 있다. 연구 과정에서 전문가 인터뷰나 회의를 진행하기도 하면서, 과연 AI가 사람을 대체할 것인지 등에 대한 연구를 지속하고 있는 것이다. 이러한 연구의 결과를 통해 정부 기관등에 정책적 제안을 하거나 기업에 혁신을 위한 단초를 제공하고자 한다. 본 보고서는 이러한 맥락에서 첫 번째 보고서이다.

본 보고서는 “2030년 인공지능과 삶”에 초점을 맞추고 다양한 전문 분야의 패널 연구를 진행했다. 패널 연구를 통해 부족했던 부분에 대해 전형적인 북미 도시를 하나의 샘플로 지정하여 연구를 진행하였다. 이는 북미 도시에서의 일반 대중들의 삶에 AI가 어떠한 영향을 주는지 그 일상적 영향력을 살펴보는 것이다. (군용 애플리케이션을 제외한) 삶과 일상을 과학적이며 기술적으로 정확한 묘사를 제공하여 일반 대중들도 본 보고서의 결과와 미래에 대한 이미지를 다음과 같이 어렵지 않게 그려낼 수 있을 것이다.

 딥러닝에 의해 전화기나 주방에서 기계들이 언어를 이해할 수 있게 되면서 사람의 음성 언어가 하나의 새로운 명령 인터페이스로 작용할 것이다. 이러한 NLP 능력의 비약적인 향상으로 인해 웹검색이나 온라인 주문이 놀랍게도 쉽게 이루어질 것이며, 이를 통한 배송, 식품가공, 제품 가공에 이르는 전반의 모든 영역에 AI가 활용되어 이전과는 다른 용이한 일상을 생각할 수 있다.

많은 언론들이 AI가 인류를 대체하여 일자리를 빼앗고 극명한 위협이 될 것이라는 예측과 견해와는 다르게, 인공지능은 인류에게 막대한 긍정적인 영향을 줄 것으로 본 보고서는 전망하고 있다.

 

❍ Comment

AI는 분명 그동안 가능하지 못했던 것들을 할 수 있는 효용성을 지닌 것은 분명하다. 이러한 부분은 본 보고서와 견해를 같이 한다. 하지만, 본 보고서에서 간과한 부분으로 이러한 AI능력을 결국은 인간이 사용한다는 점이다. 머신러닝과 딥러닝으로 이어지는 AI 기술의 비약적인 발전이, 인류에게 큰 위협이 되지는 못하더라도, 그 동안의 빈부 격차를 더욱 늘려줄 여지를 지니고 있는 것은 분명하기 때문이다.

AI Governance를 통해 AI 활용에의 지침이나 가이드라인을 마련한다고 하더라도, 근본적으로 AI의 프로그래밍적 Customizing을 막기는 어려울 것이다. 지침과 가이드라인의 권고성은 막대한 사익추구의 욕구 앞에서 얼마나 견딜 수 있는지도 미지수이다. 뿐만 아니라, AI를 활용하는 기업에 세금을 매기는 일도 쉬운일이 아니다. 로봇 한대당 세금을 부과한다고 하더라도 한 대의 기준을 어떻게 잡아야 하는지도 굉장히 어려운 부분이고, AI 소프트웨어의 경우는 더더욱 기준을 잡기 어려운 점이 있다. 확실하고 막대한 생산성의 비약적인 향상에 비해 규제를 해야할 부분들이 불확실하고 모호하기 때문에 이 간극을 줄여나가는 시간동안 사회 격차의 증가를 간과할 수 없는 부분이다.

물론 이러한 단점을 본 보고서는 인지하고 있고, 이를 사회의 ‘새로운 도전’이라고 명명하고 이를 향해 ‘열린’ 자세를 가져야 한다고 제언하고 있다. 열려있지 않은 자세가 결국은 AI 기술 발전을 저해하고 새로운 혁신의 단초를 지연시킨다는 것이다. 최대한 AI 기술 발전을 용인하고 그로 인한 사회적 영향은 정책 입안자 및 사회 과학자 등에게 균형을 잡을 것을 요구하고 있다.

여기에서 ‘균형’의 한계와 구체적인 실행 방향이 부족해 아쉬운 부분이 있다고 할 수 있다. 핵무기는 실험을 하면 그 규모의 특성에 따라 위성이나 자기장 등을 탐지하여 각 국가가 어느정도 인식을 하거나 견제를 할 수 있는 수단이 있다. 하지만, AI의 경우는 어떨까. 지금도 제3세계에서는 전쟁에 활용될 AI를 만들고 있다고 하더라도 이를 감지해내기란 여간 어려운 일이 아니다. 핵 확산 금지조약인 NPT를 통해 적극적으로 불이익을 주고 있음에도 불구하고 핵무기를 새롭게 제조하고 있는 국가가 여전히 존재한다. AI가 분명 혁신의 단초가 될 수 있지만, 그 방향을 제대로 잡지 못한다면, 파괴의 단초가 될 수도 있을 것이다.

이후의 보고서에서는 ‘균형’을 강제할 수 있는 규제적 장치나 초국가적 합의가 가능할 수 있을지에 대한 부분들에 대해 구체적이고 세부적으로 검토할 수 있다면, 보다 AI를 ‘열린’ 상태로 발전시킬 수 있지 않을까 하고 예측해본다.



2015-06-05 Computational Modeling and Simulation - 연세대학교 정보대학원 수업내용

#한국시뮬레이션학회지가 있음. 국내에서 최근 어떤 툴을 사용하고 어떤 방식으로 서술하는지 참고할 만한 곳인듯.
 
# 시뮬레이션 방법 적용 순서
Roadmap for Developing Theory Using Simulation Methods
• Begin with a research question 연구질문을 시작하고
• Identify simple theory 간단한 이론을 구체화하고
 - what is the key process?
• Choose simulation approach 시뮬레이션 접근 방법을 선택하고
• Create computational representation 프로그래밍으로 재구현하고
• Verify computational representation 해당 구현된 방법을 확인하고
• Experiment to build novel theory 새로운 이론을 구축하기 위해 실험을 진행하고
• Validate with empirical data 실험적 결과를 입증하라.
 
# 시뮬레이션 접근 방법 종류
systems dynamics 시스템 다이나믹스

• theoretical logic 이론적 논리:  cybernetics
사이버네틱스 모형, 인간의 모든 행동을 '정보와 환류를 통한 제어ㆍ조정'이라는 사이버네틱스의 관점에서 설명하려는 의사결정모형
• main constructs: stock, flow, variables, links, feedback loops (+reinforcing, -balancing)
• purpose:  understand complex causality 피드백 기반의 복잡한 인과관계에 대해 이해하기 위해
 
cellular automata / network models

 

Cellular automaton (CA). 수학적 모델로, 유한한 갯수의 "상태" 중 하나를 가질 수 있는 독립적인 "셀"들로 이루어진 공간이 있고, 각 셀들의 상태가 이산적인 시간에 따라 주변(즉, 유한한 갯수의) 셀의 상태에만 지역적으로 영향을 받는다는 가정 하에 셀들의 반응과 그로부터 생겨나는 구조를 연구하는 목적으로 쓰인다. 복잡계나 이론전산학 등에서 종종 연구되며, 인공생명의 맥락에서 생물학에서 연구하기도 한다.
 
대표적인 셀룰러 오토마타의 예로 라이프 게임(1970)이 있는데, 이 모델에서 상태는 두 종류–삶·죽음–가 있고, 각 셀은 무한한 2차원 공간에 균일하고 규칙적으로 분포해 있으며, 매 순간마다 8개의 주변 셀들 중 살아 있는 것의 갯수를 세어서 거기에 따라 다음 순간에 해당 셀이 살아 있는지 죽어 있는지가 결정된다. 각 셀은 주변 셀들의 변화에 지역적으로만 반응하며 사실 규칙 또한 매우 단순하지만, 라이프 게임에서 셀들의 반응은 생각보다 훨씬 복잡하며 튜링 완전한 계산까지 할 수 있음이 밝혀졌다. 그 밖에도 셀룰러 오토마타로 분류되는 수학적 모델은 여러 종류가 있다.
 
오토마톤 이론이란 오토마톤을 연구하는 학문이지만, 다른 표현 방식을 빌린다면 ‘대상의 어떤 기능에 주목하여, 입력과 내부 출력 각 신호의 상호관계를 수학모델로 옮기고, 이 모델을 수학적으로 고찰 ·결론을 유도한다. 그리고 이 유도된 결론을 다시 원래의 대상에 꼭 들어맞춰서 해석한다고 하는 일련의 과정의 일부 또는 전부’에 관계되는 것이다. 그리고 대상의 구성요소의 성질 등에는 그리 관여하지 않는다. 이와 같은 입장을 취함으로써 새로운 시야가 열리며, 미시적인 견지로부터는 끄집어낼 수 없는 많은 유용한 결론이 기대된다
 
• theoretical logic: simple rule-based interactions produce emergence
• main constructs: agents, connection, distance, influence
• purpose: uncover macro emergent global behavior from micro local interactions 미시적 상호작용을 통한 거시적 새로운 행동 양식을 발견하는 것.
 
NK Fitness Landscapes

Kauffman은 복잡한 생태계를 분석할 수 있는 간단한 통게적 NK모형을 제시하였다. 즉 어떤 생태계도 N개의 본질적 요인과 K개의 본질적 요인간에 상호관계를 가진 체계이며, 통계적 분석이 가능하다는 것을 보았다. {조상섭, 2012 #3}
Kauffman (1993)은 관측된 형태들이 필연적으로 선택압력에 의한 결과물인지에 대한 의문 을 제기하였다. 즉 관측된 조직형태가 자기조직화의 과정일 수 있다는 견해이다.
만일 어떤 조직들이나 개체군들이 그들의 최적 형태를 추구하기 위하여 탐색방법으로 인접한 지역 또는 주변 지형에서 Hill-Climbing방법을 사용한다면, 대부분 조직체들은 전체보다 국소적 최적화에 머물게 된다. Westhoff et al.(1996), Kauffman(1993)
즉 누적성과 비체화성이 결합된 새로운 SW는 다른 특성이 미친 영향인 상호작용의 정도를 알 수 없다. 이 러한 문제점으로 인하여 자체 특성과 함께 다른 특성사이에 상호작용이 너무 복잡하기 때문에 확률적 적응함수에 의한 그들의 결과를 바탕으로 통계적 형태를 분석할 모형을 시도하게 된다. 이러한 통계적 모형 중 가장 정교한 모형이 Kauffman의 NK모형이다.
 
기초통계자료를 사용하는 경우가 있는데, 어떤 연결점으로 사용하는지?
 
• theoretical logic: goal-driven adaptation
• main constructs: fitness landscape, complexity, interdependencies, search, sticking
points
• purpose: investigate efficacy of adaptation strategies 전략의 적용의 효능을 조사하다
 
stochastic models (전산학) 추계적 모형
 

• theoretical logic: N/A
• main constructs
• anything
• purpose: flexible approach to model building
 
의사결정과 확률적 모형
 상황에 따라 의사결정은 확실한 상황하의 의사결정, 위험상황하의 의사결정, 불확실한 상황하의 의사결정의 세 가지로 구분된다.
확실(certainty)한 상황이란 의사결정자가 결정하려는 代案(alternatives)별로 어떤 결과가 발생할 것인지에 관한 정보를 사전에 정확히 갖고 있는 상황을 말한다. 즉 결정에 따라 나타날 유일하고 확정적인 결과를 미리 알고 있는 경우이다. 이러한 상황에서 시도되는 의사결정모형을 확정적 모형(deterministic models)이라 부른다.
 위험(risk)한 상황이란 의사결정자가 갖고 있는 정보가 유일 확정적으로 알려져 있지는 않으나 대안별로 여러 개의 출현 가능한 결과와 이 결과가 각각 나타날 확률을 알고 있는 상황을 의미한다. 이러한 경우를 위해서 사용되는 의사결정모형을 확률적 모형(stochastic models)이라고 한다.
 불확실(uncertainty)한 상황이란 갖고 있는 정보가 의사결정 대안별로 나타날 결과의 일부나 전부를 명시해 주지만 이들 결과에 대한 개개의 확률을 제시해 주지 못하는 상황이다. 이러한 상황에서 의사결정은 앞의 두 경우에 비하여 매우 어렵다. 불확실성의 상황을 위험상황으로 상정하고 확률모형을 적용하는 경우가 흔하다.

 
IIS651 추계적모형 (Stochastic Models)
본 과목에서는 확률적 모형 분석을 주로 다룬다. 주요 논제로는 확률, Stochastic Process, Poisson Process, Renewal Process, Markov Process, Random Walk, Queueing Models 등이며, 기타 확률적 모형개발에 대하여도 사례를 중심으로 다룬다.
 
 
# 시뮬레이션 구현 방법
create computational representation
• use tools / frameworks
• NetLOGO, Repast, Mason, Vensim
• code from scratch
 
#
experiment to build novel theory
• systems dynamics models
• add causal loops, change flow rates
• CA/network models
• change rules/thresholds, alter connections (neighborhood, structure)
• NK fitness landscape models
• change N/K, specify interdependency, change adaptation rules, create
environmental shocks
• stochastic models
• vary source/structure of stochasticity, change theoretical logic
 
#
model validation
• a valid computational model is one that is effectively appropriate to the
end goal
• balance between “realism” and “simplicity”
• theoretical validation vs. empirical validation
• validation vs. calibration
 

+ Recent posts