장바구니 담기 close

장바구니에 상품을 담았습니다.

신문의 언어 사용 통계

신문의 언어 사용 통계

  • 정유진
  • |
  • 소명출판
  • |
  • 2013-05-25 출간
  • |
  • 345페이지
  • |
  • 153 X 224 X 30 mm
  • |
  • ISBN 9788956268767
판매가

25,000원

즉시할인가

22,500

배송비

2,300원

(제주/도서산간 배송 추가비용:3,000원)

수량
+ -
총주문금액
22,500

※ 스프링제본 상품은 반품/교환/환불이 불가능하므로 신중하게 선택하여 주시기 바랍니다.

출판사서평




신문의 언어 사용 통계
1990년대부터 코퍼스*를 구축하여 그 대규모 언어자원을 대상으로 조사·연구를 지속해온 고려대학교 민족문화연구원 전자인문팀에서 150만 어절 세종말뭉치에 기초한 『한국어 형태소 및 어휘 사용 빈도의 분석』 1(고려대학교민족문화연구원, 2000), 550만 어절 규모의 세종말뭉치로 『한국어 형태소 및 어휘 사용 빈도의 분석』 2(고려대학교민족문화연구원, 2004), 1,500만 어절 규모의 세종 형태의미분석 말뭉치를 대상으로 『한국어 사용 빈도』(한국문화사, 2009)에 이어 이번에는 4개 신문사(『동아일보』, 『조선일보』, 『중앙일보』, 『한겨레신문』)를 대상으로 새롭게 코퍼스를 구축한 『신문의 언어 사용 통계』(소명출판, 2013)가 출간 되었다.

매일, 매 순간 쉴 새 없이 쏟아져 나오는 온갖 정보가 넘쳐나는 현대사회를 이른바 ‘정보의 홍수 시대’로 표현하는 것은 더 이상 새로운 말이 아니다. 이러한 정보의 시대에서 신문만큼 다양한 정보를 수집, 정리하여 편리하고 신속하고 정확한 정보를 일목요연하게 정리하여 매일 제공하는 매체는 없다. 다양한 매체의 등장으로 신문은 현대인과 거리감이 생긴 것은 사실이지만, 아직까지 신문기사에 실린 글은 ‘사실’로 인정받고 신뢰성 높은 제1의 정보임에 틀림없다. 신문은 특히 모든 연령층에 정보 제공자로서, 사회 전반에 발생하는 사건에 대한 사실이나 해설을 전달하기 위해 정기적으로 발행한다. 이러한 신문의 매일 사회 전반의 일을 다루며 우리가 속해 있는 세상에 대해 그리고 우리가 세상에 대해 갖는 관심사를 기자의 정제된 언어로 기술하는 특성은 다시 말해 신문에서 사용되는 언어를 통해 우리는 시대의 언어 생활을 알 수 있다고 할 수 있을 것이다.

신문에 가장 많이 등장하는 고유명사는 무엇일까?
이 책에서 2000~11년까지 4개 신문사(『동아일보』, 『조선일보』, 『중앙일보』, 『한겨레신문』)에 등장하는 모든 단어를 분석한 결과 ‘미국’이다. (미국을 이어 한국, 서울, 중국이 그 뒤를 잇는다) 그러나 『신문의 언어 사용 통계』는 단순히 형태소 별 사용 빈도를 나열한 것이 아니다. 사회, 경제, 문화 등의 주제별, 연도별 키워드 분석을 통해 정치·경제·사회·문화 등의 여러 분야에 접근할 수 있다. 예를 들어 밀레니엄 분위기로 들떠있던 새천년(2000년)에는 인터넷, 벤처라는 단어가, 불법 도청과 줄기 세포로 온 나라가 떠들썩했던 2005년에는 도청과 줄기, 세포 등의 단어가, 2011년에는 원전, 등록금, 대지진 등의 단어가 많이 쓰였다. 등록금 인상 문제와 일본 대지진 등이 우리 사회의 화두였음을 짐작할 수 있는 자료인 것이다.

좀 더 자세히 살펴보면 2000년 이후 12년간 주요 4개 신문에서 사용되는 어휘 빈도를 제시하기 위해 수집된 신문 기사는 12개의 주제로 분류하였고 전자인문학팀이 구축하는 코퍼스의 주제별 구성, 기사 수 통계, 어절 수와 문장 수에 대한 자세한 통계적 사항을 포함한다. 그리고 형태소 분석 표지에 대한 간단한 설명과 분석 방법이 기술된다. 이와 함께 12년 동안 4개 신문에서 사용된 어휘범주와 문법범주의 형태소와 단어의 사용 빈도가 제공된다. 어휘범주에 해당하는 단어는 체언·용언·수식언·독립언 등이며 문법범주의 단어로는 조사·어미·접사 등을 고려한다. 지면의 제약으로 본문에서는 100개의 단어만 제시하고 부록에서 조금 더 많은 수의 단어를 보여준다.

『신문의 언어 사용 통계』는 코퍼스의 일관된 구성을 위하여 신문 기사를 주제별로 12개로 나누어 보여준다. 주제에 따라 내용을 기술하는 데 사용되는 단어가 다른 양상을 보이기도 한다. 특히 사건을 서술하기 위한 내용어, 즉 어휘범주 단어에서 그 차이를 찾아볼 수 있다. 이를 위하여 체언 중 일반명사와 고유명사, 용언 중에서 동사와 형용사 그리고 수식언에서 부사, 독립언에 포함되는 감탄사에 대한 형태소 사용 빈도를 조사하여 기술한다.

이 책에서 구축하는 신문 기사 코퍼스는 어느 특정 한 해의 텍스트를 모으는 것이 아니다. 2000년 이후 발행되는 기사이므로 시간의 경과에 따라 단어의 사용이 달라질 수 있다. 이러한 사항을 보기 위하여 어휘범주 단어들의 연도별 형태소의 사용 빈도로 구성하고, 일반명사·고유명사·동사의 빈도 분포를 제시한다. 기사를 작성하는 데 사용된 단어들이 모두 같은 비율로 사용되지 않는다. 어떤 단어들은 고빈도로 어떤 단어들은 저빈도로 사용이 된다. 전체 단어의 유형을 고려할 때 신문에서 사회 현상을 기술하는 데 많이 사용되는 단어의 유형은 우리가 생각하는 것처럼 다양하지 않다. 이런 사실은 단어의 빈도 분포로 알 수 있다. 또한 2000년부터 2011년까지 특정 연도의 주요 이슈와 사건을 알 수 있도록 연도별 키워드를 제공한다. 통계적 유의지수를 사용하여 다른 연도에 비해 관심의 대상이 되는 해에 더 많이 나오는 단어를 추출하여 특정 연도의 키워드로 보고 있다.

부록에서는 형태소 분석 표지에 따른 품사별 형태소 사용 빈도를 제공한다. 어휘범주에 해당하는 단어를 고빈도 순서로 500개를 추출하여 제공하고 이 500개의 단어를 가나다 순서로 재배열하여 보여준다. 문법범주의 단어는 그 유형이 제한된 숫자로 나타나는 경향이 있어서 고빈도 순서로만 제공한다.

이렇게 대규모로 구축된 언어 자원을 통해 21세기 현대 한국어의 어휘 사용 양상에 대한 포괄적인 정보를 얻을 수 있을 뿐 아니라 어휘 사용 양상의 이면에 내재한 사회·문화적 변화의 트렌드도 분석할 수 있는 계기를 마련하였다. 이러한 측면에서 ‘물결 21’ 코퍼스는 단순한 언어 분석의 차원을 넘어, 장기간의 사회·문화적 트렌드를 분석할 수 있게 해주는 기반 자원이 된다. ‘물결 21’ 코퍼스도 다양한 통계적 기법과 텍스트 마이닝 기술을 적용함으로써 우리에게 새로운 시야를 제공해 줄 수 있을 것으로 기대한다.

※ ‘물결 21’ 코퍼스※
‘물결 21’ 코퍼스란 고려대학교 민족문화연구원의 전자인문학팀에서 구축한 신문 기사 텍스트를 데이터베이스로 만들어 형태소 분석표지가 부착된 언어 자원. 2000~11년까지의 『동아일보』, 『조선일보』, 『중앙일보』, 『한겨레신문』의 모든 기사 텍스트를 전산화하여 어절 단위로 형태소 분석한 자료로, 12년간 수집된 자료의 양은 기사량으로 보면 약 226만 건이며 어절 수로는 5억 어절이 넘는 대규모 언어 자원이다.

문화동역학 라이브러리 문화는 복합적이고 역동적인 구성물이다. 한국 문화는 안팎의 다양한 갈래와 요소가 상호작용하는 과정을 통해 끊임없이 변화해왔고, 변화해 갈 것이다. 고려대학교 민족문화연구원이 주관하는 이 총서는 한국과 그 주변 문화의 복합적이고 역동적인 양상을 추적하고, 이를 통해 한국 문화는 물론 인류 문화에 대한 새로운 통찰과 그 다양성의 증진에 기여하고자 한다. 문화동역학(Cultural Dynamics)이란 이러한 도정을 이끌어 가는 우리의 방법론적인 표어이다.


목차


책머리에

1장 서론

2장 ‘물결 21’ 코퍼스의 구성
1. 구성 개요
2. 기사 수 통계
3. 어절 수와 문장 수 통계

3장 전체 형태소 사용 빈도
1. 어휘범주 형태소 사용 빈도
1) 체언 2) 용언
3) 수식언 4) 독립언:감탄사(IC)
2. 문법범주 형태소 사용 빈도
1) 조사 2) 어미
3) 접사

4장 주제별 형태소 사용 빈도
1. 체언
1) 일반명사(NNG) 2) 고유명사(NNP)
2. 용언
1) 동사(VV) 2) 형용사(VA)
3. 수식언/독립언
1) 감탄사(IC) 2) 일반부사(MAG)

5장 연도별 형태소 사용 빈도
1. 체언
1) 일반명사(NNG) 2) 고유명사(NNP)
2. 용언
1) 동사(VV) 2) 형용사(VA)
3. 수식언/독립언
1) 감탄사 2) 일반부사

6장 단어의 빈도 분포
1. 고빈도 단어의 분포
2. 빈도에 따른 유형 수

7장 키워드
1. 주제별 키워드
2. 연도별 키워드

참고문헌
필자 소개

부록 태그별 형태소 사용 빈도
1. 어휘범주 형태소 사용 빈도
1) 일반명사 2) 고유명사
3) 의존명사 4) 대명사
5) 수사 6) 동사
7) 형용사 8) 보조용언
9) 지정사 10) 관형사
11) 일반부사 12) 접속부사
13) 감탄사
2. 문법범주 형태소 사용 빈도
1) 주격조사 2) 목적격조사
3) 관형격조사 4) 부사격조사
5) 호격조사 6) 인용격조사
7) 보조사 8) 선어말어미
9) 어말어미 10) 명사형 전성어미
11) 관형사형 전성어미 12) 접사
3. 기호 사용 빈도
1) 마침표, 물음표, 느낌표
2) 쉼표, 가운뎃점, 콜론, 빗금, 줄표, 물결
3) 따옴표, 괄호표
4) 줄임표 5) 붙임표
6) 외국어 7) 한자
8) 기타기호 9) 숫자

교환 및 환불안내

도서교환 및 환불
  • ㆍ배송기간은 평일 기준 1~3일 정도 소요됩니다.(스프링 분철은 1일 정도 시간이 더 소요됩니다.)
  • ㆍ상품불량 및 오배송등의 이유로 반품하실 경우, 반품배송비는 무료입니다.
  • ㆍ고객님의 변심에 의한 반품,환불,교환시 택배비는 본인 부담입니다.
  • ㆍ상담원과의 상담없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다.
  • ㆍ이미 발송된 상품의 취소 및 반품, 교환요청시 배송비가 발생할 수 있습니다.
  • ㆍ반품신청시 반송된 상품의 수령후 환불처리됩니다.(카드사 사정에 따라 카드취소는 시일이 3~5일이 소요될 수 있습니다.)
  • ㆍ주문하신 상품의 반품,교환은 상품수령일로 부터 7일이내에 신청하실 수 있습니다.
  • ㆍ상품이 훼손된 경우 반품 및 교환,환불이 불가능합니다.
  • ㆍ반품/교환시 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한될 수 있습니다.
  • ㆍ스프링제본 상품은 교환 및 환불이 불가능 합니다.
  • ㆍ군부대(사서함) 및 해외배송은 불가능합니다.
  • ㆍ오후 3시 이후 상담원과 통화되지 않은 취소건에 대해서는 고객 반품비용이 발생할 수 있습니다.
반품안내
  • 마이페이지 > 나의상담 > 1 : 1 문의하기 게시판 또는 고객센터 1800-7327
교환/반품주소
  • 경기도 파주시 문발로 211 1층 / (주)북채널 / 전화 : 1800-7327
  • 택배안내 : CJ대한통운(1588-1255)
  • 고객님 변심으로 인한 교환 또는 반품시 왕복 배송비 5,000원을 부담하셔야 하며, 제품 불량 또는 오 배송시에는 전액을 당사에서부담 합니다.