◈ 이 책의 대상 독자 ◈
이 책은 데이터 포인트를 풀고, 위상(topology) 정보를 활용해 분석과 모델의 성능을 개선하려는 데이터 분석가, 그래프 개발자, 그래프 분석가, 그래프 전문가를 대상으로 한다. 머신러닝 기반 그래프 데이터베이스를 구축하려는 데이터 과학자와 머신러닝 개발자에게도 유용하다. 그래프 데이터베이스와 그래프 데이터에 대한 초급 수준의 지식을 가지고 있는 사람이 읽기에 적합한 책이다. 이 책의 내용을 최대한 활용하기 위해서는 파이썬 프로그래밍과 머신러닝에 대한 중급 수준의 실무 지식 또한 필요하다.
◈ 이 책의 구성 ◈
1장, "그래프 시작하기’에서는 NetworkX 파이썬 라이브러리를 사용해 그래프 이론의 기본 개념을 소개한다.
2장, ‘그래프 머신러닝’에서는 그래프 머신러닝과 그래프 임베딩 기술의 주요 개념을 소개한다.
3장, ‘그래프 비지도 학습’에서는 비지도 그래프 임베딩의 최신 방법을 다룬다.
4장, ‘그래프 지도 학습’에서는 지도 그래프 임베딩의 최신 방법을 다룬다.
5장, ‘그래프에서의 머신러닝 문제’에서는 그래프에서 가장 일반적인 머신러닝 작업을 소개한다.
6장, ‘소셜 네트워크 그래프’에서는 분석 소셜 네트워크 데이터에 머신러닝 알고리듬을 적용하는 방법을 소개한다.
7장, ‘그래프를 사용한 텍스트 분석 및 자연어 처리’에서는 자연어 처리 작업에 머신러닝 알고리듬을 적용하는 방법을 소개한다.
8장, ‘신용카드 거래에 대한 그래프 분석’에서는 신용카드 부정 거래 탐지에 머신러닝 알고리듬을 적용하는 방법을 소개한다.
9장, ‘데이터 드리븐 그래프 기반 응용 프로그램 구축’에서는 큰 그래프를 처리하는 데 유용한 몇 가지 기술을 소개한다.
10장, ‘그래프의 새로운 트랜드’에서는 그래프 머신러닝의 몇 가지 새로운 동향(알고리듬과 응용 프로그램)을 소개한다.
◈ 옮긴이의 말 ◈
처음 접하는 이들에게는 그래프 데이터가 어렵게 느껴질 수 있다. 하지만 그래프 데이터는 우리의 일상과 친숙해질 수 있는 데이터 형식이다. 사회는 복잡한 관계의 연속으로 구성되는데, 노드와 간선으로 표현되는 그래프 데이터는 이러한 관계의 표현을 가장 잘 나타낼 수 있는 데이터 형식이다. 관계 표현을 가장 쉽게 할 수 있다는 강점이 있어 최근에는 그래프 형식으로 데이터를 저장하는 데이터베이스 등이 각광받고 있다.
이 책은 그래프 데이터를 다루기 위한 아주 기본적인 것들로 시작해서, 실생활에 적용할 수 있는 예시를 통해 보다 쉬운 이해를 제공한다. 예시를 통해서 그래프 데이터를 다루는 기본기를 쌓고, 머신 러닝 알고리즘들을 활용해 고급 응용 스킬들을 배워볼 수 있다. 단순히 이론적인 설명에서 끝나는 것이 아니라 실제 서비스에 필요한 기본 지식들을 소개한다는 점에서 훌륭한 책이다. 물론 나와있는 내용만으로 그래프 머신 러닝 전문가가 될 수 있다고는 할 수 없을 것이다. 그러나 훌륭한 시작을 함께하기 위해 좋은 책이라고 생각한다.
이 책에서는 보다 복잡한 설명이나 심도 있는 이해가 필요한 부분에 참고할 만한 자료들에 대한 소개가 나와있다. 이러한 참고 자료들을 찾아보고 스스로 새로운 문제를 해결하기 위해 노력해보기를 꼭 권장한다. 이러한 노력이 인공지능 연구의 선도자가 되는 길이라고 생각한다.