국어학 지식과 통계학 지식을 함께 습득하도록 해…
이 책에는 한국어에서 관찰되는 여러 언어 현상들을 조사한 후 통계 분석 프로그램을 이용하여 그 현상들에 관한 양적 연구를 하는 일련의 과정이 서술되어 있다. 그럼으로써 독자들이 국어학 지식과 통계학 지식을 함께 습득하도록 하는 것이 이 책의 집필 목적이다.
언어는 고정된 것이 아니라 유기체적인 속성을 지니고 있고, 그에 따라 언어의 여러 문법 현상들도 경험 과학적 방법으로 기술되고 있다. 이에 객관적인 수치를 통해 특정 가설을 ‘수립, 지지, 폐기, 그리고 수정’하게 되는 일련의 과정을 확률적으로 판정하는 통계(statistics)는, 이러한 언어의 속성을 기술하는 데에 유용한 방법의 하나로 고려될 수 있다.
실제로 국어학 연구도 이미 이론 중심의 연구에서 계량적ㆍ양적 연구로 그 저변을 활발히 넓히고 있다. 기존의 국어학 논의가 연구자의 내성적 판단이나 선행 연구의 자료를 바탕으로 수행해 왔다면, 최근에는 코퍼스(corpus)나 실험으로 확보한 데이터를 바탕으로 논의가 진행되고 있다. 이는 연구자의 엄정한 판단을 통해 논의가 진행되고 있음에도 불구하고, 내재적 주관으로 인해 객관성을 담보 받기 어렵다는 비판에 대한 반성에서 비롯된 것으로 생각된다. 즉, 같은 국어 현상을 대상으로 연구를 진행하더라도, 연구자의 직관에 따라 서로 다른 논의가 생산되어 온 것이 현실인데, 집단의 판단을 객관적으로 기술하는 통계학의 방법론을 수용함으로써 논의의 객관성을 담보 받고자 한 것이다.
국어 현상에 대해 집단의 수용성을 객관적으로 파악할 수 있는 조사 방법 소개하고,
그 결과에 대한 통계 분석 방법을 제공. 그리고 도출된 통계 결과 해석하는 방법도 살펴봐…
이 책에서는 문제가 되는 국어 현상에 대해, 집단의 수용성을 객관적으로 파악할 수 있는 조사 방법을 소개하고, 그 결과에 대한 통계 분석 방법을 소상히 제공할 것이다. 그리고 도출된 통계 결과를 해석하는 방법도 살펴볼 것이다.
국어 현상에 대한 통계 분석은 다음과 같은 절차로 진행되어야 할 것이다. 첫째, 국어 현상을 발견하고, 그에 해당하는 이론을 이해해야 한다. 둘째, 통계 분석에 필요한 데이터를 수집하기 위해 설문조사를 해야 하므로, 설문지를 작성하는 방법을 숙지해야 한다. 그러한 과정은 객관적인 방법과 절차로 이루어져야 할 것이다. 셋째, 통계 분석을 하기 위해 데이터를 부호화하는 과정이 필요하다. 넷째, 엑셀과 SPSS 등의 프로그램을 활용하여 데이터들의 속성에 부합하는 적절한 통계 분석을 해야 한다. 다섯째, 분석 결과를 해석하여 국어 현상에 대한 객관적인 결과를 제공해야 한다. 이러한 결과들을 중심으로 우리는 국어 정책 등에 다양한 제언을 할 수 있을 것이다.
물론 이러한 양적 연구에 큰 흥미를 지니고 있지 않더라도, 통계학을 통해 국어 변이를 설명하는 연구가 꾸준히 생산되고 있다는 점을 고려한다면, 적어도 그러한 논의들에서 빈번히 사용되는 통계학의 용어, 범주, 그리고 분석 방법 등을 어느 정도로는 이해하고 있어야 할 필요가 있다. 이 책은 그러한 이해를 돕기 위해 통계학의 다양한 용어와 범주, 그리고 분석 방법 등을 국어학 논의에 대입하여 소상히 제공하고자 한다.