글과 그림만 가지고 생성형 AI를 설명하는 책
플로(flow)에 기반한 생성 기술, 특히 확산 모델은 이미지, 오디오, 비디오 생성 등 많은 분야에서 두각을 나타냈다. 일본 최고의 AI 전문가 오카노하라 다이스케는 《확산 모델의 수학》을 집필해 확산 모델을 수학적으로 명확히 해설한 바 있고, 이번에는 수학 공식 없이 글과 그림만으로 생성형 AI 전반을 설명하는 《생성형 AI의 구조》을 썼다.
비전문가도 이해할 수 있도록 생성형 AI의 역사부터 플로, 확산 모델과 플로 매칭, 최적 운송, 향후 전망까지 술술 읽히게 저술했다. 수식을 배제하는 대신 우리가 사는 세계에서 접할 수 있는 일상적인 비유를 활용하는 편으로, 예를 들어 확산 모델에 대해서는 다음과 같이 설명을 시작한다.
“물 표면에 잉크로 글자를 썼다고 가정해봅시다. 이 잉크로 쓰여진 글자는 시간이 지남에 따라 서서히 풀어져갈 것이고 최종적으로는 잉크가 물 전체에 균일하게 섞이게 됩니다. (…) 만약 이 잉크의 확산 과정을 반대 방향으로 재현할 수 있다면, 잉크가 물에 균일하게 섞인 상태로부터 다시 잉크로 문자가 쓰여진 상태로 되돌릴 수 있습니다. 즉, 질서를 가지고 있는 대상에 노이즈가 더해지면서 서서히 파괴되어 완전한 무질서가 되는 과정을 역방향으로 거슬러 올라감으로써 무질서로부터 질서를 만들어내는 과정, 즉 생성을 실현할 수 있지 않을까 하는 생각인 것입니다.“
오카노하라 다이스케는 일본 최대 AI 유니콘 Preferred Networks의 공동창업자로 유명하지만 10여 권 이상의 전문서를 집필해 ‘기술을 둘러싼 풍부한 맥락을 제공’한다는 평가를 받는 베테랑 저자이기도 하다. 그의 친절하면서도 정확한 해설과 함께 오늘날 IT의 중심에 선 생성형 AI의 구조를 제대로 이해해보자.
추천평
《확산 모델의 수학》에서 수식을 좇기만 할 뿐 이해하지는 못했던 저에게는 생성형 AI의 역사, 열역학과의 관계, ‘흐름’에 기반한 설명 등 생성 모델을 직관적으로 이미지화할 수 있는 구성이어서 매우 이해하기 쉬웠습니다. 생성 모델의 원리를 충분히 이해하고 있다면 비유로만 설명한 것이 오히려 이해하기 어려울 수 있고, 반대로 기초 지식이 전혀 없다면 애초에 무슨 이야기를 하는 건지 알 수 없을 테지만, 생성 모델의 원리를 이해하고자 공부하려는 분들이라면 이 책이 딱 맞을 거라고 생각합니다.
manic::moon, 일본 아마존 독자