디지털 혁신(digital innovation) 시대에 가장 핵심적인 자산은 빅데이터(big data)이며, 데이터 기반 기술혁신을 바탕으로 모든 것이 변화하고 있다. 그러나 빅데이터가 정확히 무엇을 의미하는지, 데이터를 활용한다는 것의 의미가 무엇인지 알고 있는 사람은 많지 않은 것 같다.
대학에서도 빅데이터 분야에 대한 관심이 높아지면서 교양 수준의 강의를 위해 많은 교과목이 개설되어 운영되고 있으나 데이터 분석 및 활용 측면보다는 대부분 빅데이터와 관련된 기초수준의 개념들을 전달하는 데 머무르고 있다. 따라서 빅데이터의 개념, 데이터 활용의 의미는 물론 데이터를 실제로 다루어보는 측면에 초점을 맞추어 교재를 개발할 필요성이 요구되고 있다.
「EXCEL 고급 기능을 이용한 데이터 이해 및 활용」은 최근의 빅데이터 환경에 대해 살펴보고 데이터 처리, 데이터 분석, 시각화 기법 등을 활용할 수 있는 능력을 배양하는 데 도움을 주고자 하는 목적으로 집필되었다. 이를 위하여 Microsoft EXCEL의 고급 기능(powerful tools)을 이용하여 데이터를 활용할 수 있는 방법을 소개한다.
EXCEL은 빅데이터 분석 도구로는 부족할 수 있지만 데이터 구조화 및 요약 기능은 물론 기초적인 분석 기능을 갖추고 있고 시각화를 위한 차트(charts) 활용 등이 매우 편리하다. 이 책은 EXCEL에서 제공하는 기본 기능은 물론 여러 고급 기능(Power Query, Power Pivot, Charts, Data Analysis Tools), 그리고 Power BI 등을 활용하는 방법에 대해 안내하며, 전체적인 내용은 10개의 장으로 구성되어 있다.
1장에서는 데이터와 정보, 데이터와 관련된 컴퓨터 환경의 변화 그리고 빅데이터의 정의와 의미에 대해 살펴본다. 2장에서는 EXCEL에 대한 간단한 소개와 몇 가지 주요 기능, 그리고 함수의 활용 방법에 대해 살펴본다. 이 책의 목적이 EXCEL의 기초 사용법을 설명하는 것은 아니기 때문에 이에 대한 내용은 최소한으로 구성하였다. 3장과 4장에서는 Power Query, Pivot Table 및 Power Pivot 기능의 활용 방법을 소개한다. Power Query는 다양한 데이터 원본으로부터 데이터를 가져와 원하는 형태로 구조화하고 편집할 수 있는 기능으로 데이터를 분석할 수 있는 형태로 변환하거나 준비하는 엔진이라 할 수 있다. Power Pivot은 다양한 원본의 대용량 데이터 간의 관계를 설정및 구축하여 집계 정보를 산출할 수 있는 기능이다.
5장과 6장에서는 데이터 분석에 필요한 통계적 개념과 통계적 추론(statistical inference) 과정에 대해 설명한다. 7장과 8장에서는 평균 비교(t-검정, 분산분석), 상관분석, 회귀분석 등 기본적인 데이터 분석 기법들에 대해 살펴보고, 이러한 분석 기법을 EXCEL의 데이터 분석 도구를 활용하여 데이터에 적용해 본다. 9장에서는 데이터 시각화의 개념에 대해 간단히 살펴보고, 그래프(차트) 생성 및 편집 방법 등에 대해 설명한다.
10장에서는 Power BI(business intelligence)의 활용을 살펴본다. Power BI는 데이터를 분석 및 시각화하여 신속한 의사결정을 할 수 있도록 도와주는 비즈니스 분석 서비스이며 EXCEL에 포함되어 있는 기능은 아니지만 EXCEL을 비롯한 다른 도구와 연결하여 사용할 수 있다.
이 교재는 데이터를 분석하기 전에 어떤 과정을 거쳐 데이터를 준비해야 하는지에서부터 데이터를 집계하고 분석하는 방법, 차트를 생성하고 편집하는 과정 등 데이터 활용에 대한 전반적인 사항을 담고자 노력하였으며, 독자들 스스로 실습하는 데 실질적인 도움이 될 수 있도록 내용을 구성하였다.
좋은 책을 위해 노력하였으나 오류가 있을 수 있다. 이 점은 양해를 바라며, 출간 후 나올 수 있는 수정사항 등은 자유아카데미 홈페이지(www.freeaca.com) 자료실에 제공할 예정이니 참고하길 바란다. 끝으로, 이 교재를 통해 독자 여러분이 데이터 활용의 개념을 이해하는 데 큰 도움이 되기를 기대한다.