십자말풀이 판 분석

십자말풀이 판의 배치는 모든 참가자에게 보이지만, 각 문제가 어떤 유형인지는 참가자가 알 수 없다. 내 의지에 따라 내가 원하는 문제 유형을 고르기 위해, 십자말풀이 판의 규칙성을 정량적으로 분석했다.

2018-2019년 십자말풀이 판을 바탕으로 분석했다.

겹치는 글자 수에 따른 분석

십자말풀이 판을 보면 기본적으로 처음 배치에서 단어당 겹치는 글자의 숫자를 셀 수 있고, 문제를 풀어가며 겹치는 글자가 열린 문제를 풀 수도 있다. 따라서 문제마다 십자말풀이 판에 대한 정보를 2개의 숫자로 압축할 수 있는데, 하나는 “이 단어의 몇 글자가 다른 단어와 겹치는지”, 하나는 “이 문제가 열렸을 때 몇 글자나 공개되어 있었는지” 이다. 첫 번째를 “처음부터 겹침”을 줄여서 “처겹”, 두 번째를 “열렸을 때 보임”을 줄여서 “열보”라고 하자.

처겹과 열보에 대한 전체 통계는 아래와 같다.

처겹 히스토그램에서 볼 수 있듯 대부분의 단어는 단 한 지점에서 다른 단어와 겹친다. 반면 열보 히스토그램을 보면, 열렸을 때 보이는 글자 숫자는 0개가 반, 1개가 반 정도다.

처겹과 열보 정보를 바탕으로 문제 유형을 알아맞힐 수 있을까? 각 (처겹, 열보) 좌표에 따라서 문제 유형의 비율이 어떻게 바뀌는지 살펴보자. 아래 분석에서는 십자말풀이 판을 봤을 때 문제 유형이 당연한 첫소리, 자물쇠 문제는 제외하였다.

파이 그래프의 크기를 각 (처겹, 열보) 좌표에 해당하는 문제의 숫자에 비례하게 하되, 최소 크기보다는 작아지지 않게 했다. 파이 그래프를 잘 살펴보면, 처겹이 높아질수록 일반문제일 확률이 높아지고, 열보가 높아질수록 일반 문제일 확률이 높다. 따라서 다른 사람들의 실력을 쓰기 문제를 통해 손해 없이 알아내고 싶다면 처겹과 열보가 낮은 문제를, 일반 문제를 풀고 싶다면 처겹과 열보가 높은 문제를 푸는 것이 바람직하다.

첫소리와 자물쇠 문제가 각각 가장 먼저, 가장 늦게 열리는 문제임을 고려하면 다음과 같은 생각 역시 가능하다. 첫소리와 겹치는 문제는 이미 글자가 열려있기 때문에, 열보가 높아 일반 문제일 확률이 높다. 반면 자물쇠 문제와 겹치는 문제는 항상 글자가 열려있지 않기 때문에, 일반 문제일 확률이 낮으리라 추측할 수 있다.

계산해보니 실제로 첫소리 문제와 겹치는 문제가 자물쇠 문제가 아닐 때는 90.5% 확률로 일반 문제인 반면, 자물쇠 문제와 겹치는 문제가 첫소리 문제가 아닐 때는 일반 문제가 아닐 확률이 78.6%이나 된다. 특히 자물쇠 문제의 효과는 단순히 열보=0으로는 설명되지 않는, 자물쇠 문제만의 효과다 (열보=0일 때 일반 문제일 확률은 40%를 웃돈다).

이런 정보를 이용하면, 풀고 싶은 문제의 유형을 고를 확률을 높일 수 있다. 하지만 이 숫자들이 100%에 가깝지는 않은 것을 고려할 때, 자신의 예상이 어긋날 수도 있음을 염두에 두어야 할 것이다.