작도닷넷 블로그
작도닷넷 블로그

일기

글의 의미는 어떻게 생겨나는가

08/03/18 12:07(년/월/일 시:분)

자음: 19개 (ㄱㄴㄷㄹㅁㅂㅅㅇㅈㅊㅋㅌㅍㅎ ㄲㄸㅃㅆㅉ)
모음: 21개 (ㅏㅑㅓㅕㅗㅛㅜㅠㅡㅣㅐㅒㅔㅖㅘㅙㅚㅝㅞㅟㅢ)

한 음절은 초성+중성+종성으로 구성됨.
이때 종성은 없어도 되므로 한 음절의 가능성은 19*21*(19+1)=7980개.

1음절의 단어는 7980개
2음절의 단어는 (7980)^2=63680440개
3음절의 단어는 (7980)^3=508169592000개
4음절 4055193344160000개
5음절 32360442886396800000개
6음절 258236334233446464000000개
7음절 2060725947182902782720000000개
8음절 16444593058519564206105600000000개
9음절 1.31227852606986122364722688e+35
10음절 1.04719826380374925647048705024e+39
11음절 8.3566421451539190666344866609152e+42
12음절 6.6686004318328274151743203554103e+46

국어사전에 나온 가장 긴 단어는 12음절로, 이를 다 포함하면 약 6*10^46개 정도의 단어가 가능하다. 그런데 국어사전의 단어수는 21만개 정도로, 우리는 실제로 글자가 가능한 범위 중에서 3*10^(-45)%밖에 사용하지 않고 있다.

즉 글의 전체집합은 엄청나게 크고, 그 중에서 실제로 의미를 가지는 글은 1조분의 1조분의 1조분의 1조분의 1조분의 3천분의 1밖에 안 된다.


영어의 경우 알파벳이 26자이고, 가장 긴 단어가 45자라고 하니까, 마찬가지로 46음절 영어의 가능성은 26^45=4.7184641388877797545092303390143e+63, 마찬가지로 천문학적인 숫자가 나온다. 영어사전의 단어수도 20만개 정도로 국어사전과 비슷하다.

즉 언어에 상관없이
1. 글이 가능한 전체집합은 엄청나게 크고
2. 그 중에서 일상생활에서 사용하는 단어는 3천~5천개 정도이며
3. 전문용어를 다 포함해도 20만개를 넘지 않는다.



자, 다시.

실제로 일상생활에서 활용하는 단어를 3000개라고 가정하자. 단어와 단어가 모여 문장을 구성할 때, 문장이 가능한 갯수 또한

2단어로 구성된 문장: (3000)^2=9000000개
3단어로 구성된 문장: (3000)^3=...아까와 마찬가지로 엄청 많을 것 같다.

이 전체 문장 중에서 단어와 단어가 관계를 맺어 의미를 가지는 경우 또한, 아까와 마찬가지로 극히 일부에 지나지 않을 것이다.


결론. 글은
1. 무한하지는 않지만 엄청나게 큰 전체집합을 가지며
2. 그 중에서 실제로 의미를 가지는 부분은 극히 일부에 지나지 않는다.


이런 글의 의미를 현재 컴퓨터의 성능으로 계산하려면, 불가능하지는 않겠지만 아주 오랜 시간이 걸릴 것이다.

현재 시맨틱웹(semantic web)에서는 기본적으로 쓰이는 단어의 수를 100여개로 제한하고 있는데, 내가 보기에는 단어의 수를 줄여봤자 크게 쓸모가 있을까 싶다. 에스페란토어처럼 표준은 존재하는데 실질적으로 쓰이지 않는 표준(de jure standard)이 되지 않을까.

http://en.wikipedia.org/wiki/De_jure


도대체 인간은 어떻게 이 거대한 글의 세계에 의미를 부여하고 살아가는 걸까.

의미는 마치 그 자체로도 생명 같다.

http://xacdo.net/tt/rserver.php?mode=tb&sl=1045

  • 이옹 08/03/19 01:49  덧글 수정/삭제
    의미를 갖는 조합이 적을 거라고는 생각했지만, 3*10^-45%라니 엄청나네요;
    그리고 전 요새는 의미뿐이 아니라, 인간이 만들어낸 모든 시스템이 생명 같다는 느낌을 받습니다.
이름
비밀번호
홈페이지 (없어도 됩니다)

비밀글로 등록
작도닷넷은 당신을 사랑합니다.

[이전 목록]   [1] ... [564][565][566][567][568][569][570][571][572] ... [822]   [다음 목록]

최근 글

이웃로그 관리자 옛날 작도닷넷 태터툴즈 ©현경우(xacdo) since 2001