최종 점수와 등수

몇 점을 얻어야 [우리말 겨루기]에서 1등을 안정적으로 할 수 있을까? 이 질문은 특히 우리말 달인을 하기 위해 공부하는 사람들에게 중요하다. 필자가 느끼기에는 1등을 하기 위해 필요한 공부보다는, 달인이 되기 위해 필요한 공부가 압도적으로 많다. 그러나 달인이 되려면 반드시 1등을 해야 하므로, 달인이 목표라면 1등이 되기 위한 공부는 정확히 필요한 만큼만 하고 달인 문제 공부에 집중하는 것이 바람직하다.

1등이 되려면 몇 점을 얻어야 하는가는, 1등이 일반적으로 몇 점을 얻는가 하는 문제와는 미묘하게 다르다. 1등을 하는 사람 중에는 안정적으로 1등을 하기 위한 점수를 훌쩍 넘기는 사람도 있기 때문이다. 다시 명확히 말하면, 우리가 답을 얻고자 하는 문제는, “이길 확률을 90%로 만들려면 최소한 몇 점을 안정적으로 얻을 수 있어야 할까?” 하는 문제이지 “1등 상위 90%는 몇 점을 얻을까?” 하는 문제와는 다르다.

구하는 값을 정확히 정의해보자. 전체 참가자 집합을 P, 각 참가자의 최종 점수를 구하는 함수 \text{score}: P \to N, 그리고 n등을 한 참가자를 원소로 갖는 집합 P_n (n \in \{1, 2, 3, 4\})를 두자. 다음으로, 특정 점수를 가진 사람들의 집합을 정의한다:

S(x, s) = \{p \in P | x - 50s \leq \text{score}(p) \leq x + 50s \}

S(x, s)는 ‘x \pm 50s라는 최종 점수를 가진 참가자의 집합’을 가리킨다. s는 노이즈를 줄이기 위해 도입한 변수인데, s가 클수록 x \pm 50s의 범위가 넓어져 더 많은 데이터를 포함하는 대신, S 함수가 x 자체에는 민감하게 바뀌지 못한다.

이러한 정의를 바탕으로 점수 x 점을 받았을 때, n등을 할 확률을 구할 수 있다. 식은 아래와 같다.

P(\text{nth place}|\text{score x}) = \frac{|S(x, s) \cap P_n|}{|S(x, s)|}

위 공식을 바탕으로, 2018년과 2019년 참가자들의 데이터를 이용해 특정 최종 점수를 얻었을 때 1등을 할 확률을 구했다.

이 그래프를 읽기 위해서는, 예상 점수나 목표 확률을 잡는 것이 편하다. 가령 예상 점수가 1500점이라고 하자. 그래프를 x=1500에서 자른 단면은 80% 빨강, 20% 초록이다. 그러면 1등을 할 확률이 대략 80%, 2등을 할 확률이 20%이다. 한편, 1등을 할 확률이 60% 이상이 될 만큼의 점수가 궁금하다고 하자. 그래프를 y=0.6에서 다른 단면이 빨강과 처음 만나는 지점은 대략 x=1350이다. 따라서 이길 확률을 60% 이상이 되게 하려면, 점수를 1350점 이상 얻어야 한다고 그래프를 읽을 수 있다.

다시 말하지만 이것은 일반적인 1등이 몇 점을 얻는가 하는 문제와는 다르다. (1등의 중앙값으로 정의된) 상위 50% 1등의 일반적인 점수는 1600점이지만, 50%의 확률로 1등을 하기 위해서는 약 1300점만 득점하면 된다.