주요 내용
이 책은 다음과 같이 구성되어 있다.
● 1부에서는 ‘네트워크’의 특성과 등장 배경을 소개하고, 네트워크 데이터 분석에 필요한 기초용어와 R 패키지들을 다룬다. 또한, 본서에서 소개할 네트워크 데이터와 해당 데이터 분석을 위해 필요한 R 패키지들 및 각 패키지의 활용법을 설명한다.
● 2부에서는 네트워크 데이터를 대상으로 한 전통적인 기술통계분석 기법들을 소개한다. 먼저 통상적인 형태의 데이터와 네트워크 데이터의 차이를 예시를 통해 설명하고, 네트워크를 구성하는 노드(점, 행위자) 데이터와 링크(선, 연결, 유대) 데이터가 전체네트워크 데이터를 어떻게 구성하는지 설명한다. 이후 노드수준과 링크수준, 그래프 수준에서 계산할 수 있는 네트워크 통계치들을 알아보고, R을 이용한 네트워크 분석에서 많이 활용되는 네트워크 statnet 패키지와 igraph 패키지로 해당 네트워크 통계치들을 계산하는 방법을 실습한다. 아울러 네트워크를 시각화하는 방법과 전체네트워크를 여러 개의 하위네트워크로 나누는 기법들[파벌(cliques), 핵심집단(k-core), 콤포넌트(component) 분석, 위상분석(position analysis), 노드집단 탐색 알고리즘(community-detection algorithm) 등]에 대해서도 소개한다.
● 3부에서는 시뮬레이션이나 순열(permutation)을 토대로 네트워크 데이터에 적용할 수 있는 전통적 추리통계분석 기법들로 ‘조건부 단일 그래프(CUG, conditional uniform graph) 테스트’와 ‘이차순열할당과정(QAP, quadratic assignment procedure) 테스트’를 소개한다.
● 4부에서는 최근 인기를 얻고 있는 네트워크 모델링 기법인 ‘지수족 랜덤그래프 모형(ERGM)’과 ‘확률적 행위자중심 모형(SAOM)’ 중 가장 널리 사용되는 ‘시뮬레이션 기반 네트워크 분석(SIENA) 모형’을 소개한다.
● 5부에서는 네트워크 분석 및 모델링과 관련하여 앞에서 다루지 않은 부분들을 간략히 소개하고, 관련 참고문헌들을 제시한다. 아울러 네트워크 분석과정에서 유의할 점을 정리하여 네트워크 분석 및 모델링 작업을 실시할 때 살펴볼 수 있도록 한다.