2020년 11월 23일 방영. 25세의 강성민 참가자가 우승했다. 특히 우승과 직결된 정답률 측면에서, 단 한 문제도 틀리지 않아 100%의 정답률을 달성했다.
강성민 참가자는 진승민 참가자가 놓친 첫소리 문제를 맞힌 이후, 어느 시점에서도 선두를 놓치지 않았다. 2등과의 점수 차이가 500점을 넘기면 선두가 뒤집히는 경우가 굉장히 드문데, 그런 점수 격차를 14번 문제에서 달성했다. 꾸준한 득점으로 자물쇠 문제 전에 1500점을 얻었는데, 자물쇠 문제를 풀지 않고도 1등을 할 확률이 80% 정도인 점수였다.
남은 자물쇠 문제 역시 강성민 참가자가 모두 가져가면서 최근 5년 중 가장 높은 점수를 얻는 데 성공했다.
강성민 참가자는 대략 8번 문제부터 1등의 상위 10% 점수를 벗어나, 그 밑으로 처지는 시점이 없었다. 다른 참가자들은 대체로 등수에 맞는 점수 궤적을 그렸다. 진승민 참가자는 자물쇠 문제를 맞히지 못해 마지막에는 일반적인 2등이 얻는 점수에서 이탈했다.
강성민 참가자는 (당연히) 20대 남자 가운데 가장 높은 성적을 보였으며, 다른 참가자들은 특이점이 없었다.
박형기 참가자는 경쟁 문제는 하나도 맞히지 못했지만, 비경쟁 문제는 모두 맞힌 특이한 경우였다. (1.0으로 표시되지 않는 것은 통계적 보정 때문이다.) 진승민 참가자는 정답률과 시도 모두 일반적인 참가자와 비슷하였으며, 속도가 빨랐다.
진승민 참가자와 강성민 참가자를 비교하면, 강성민 참가자가 속도를 제외한 모든 면에서 큰 차이로 앞섰다.
안녕하세요, [우리말 겨루기] 835회 출연자 강성민입니다. 방송을 통해 보셨겠지만 저는 [우리말 겨루기]를 정량적으로 분석하여, 십자말풀이에서 2500점을 득점했습니다. 2500점은 제가 모은 [우리말 겨루기]의 5.5년 방영 데이터 중 가장 높은 점수입니다.
이 글은 가볍게 제가 어떤 사람인지, 왜 이런 작업을 시작했는지, 그 과정에서 어떤 걸 느꼈는지를 다룹니다. 준비한 방법은 쓰다보니 길어져 분리했습니다.
성격 유형
제 외모를 TV에서 보셨으니, 제 내면도 보여드리면 재밌을 것 같아 3종류의 성격 검사를 해보았습니다. 각각 요새 유행하는 MBTI, 심리학자들이 실제로 연구에 쓰는 Big Five 성격 지표, 그리고 얼마나 ‘나쁜 남자’인지 측정하는 Dark Triad입니다.
먼저 MBTI 결과를 보여드리면 (그림이 영어인 점은 죄송합니다…):
한국어로는 이 유형을 청렴결백한 논리주의자라고 하더군요. 이 성격에 대한 설명글을 읽어보면, 다른 설명은 잘 모르겠지만 이 부분 하나는 저와 잘 맞는다고 생각합니다:
논리주의자형 사람이 무언가를 하겠다고 하면 얼마나 많은 희생이 따르던지 자신이 한 말에 책임을 지고자 기어이는 해내고야 맙니다.
이런 성격이 아니었으면 수백 시간동안 단어를 외우는 짓은 아마 못했겠죠.
다음은 심리학 연구에 사용되는 Big Five입니다.
개인적으로 Big Five 성격지표가 제 특성을 더 잘 보여준다고 생각합니다. 저는 호기심이 많아 다양한 시도를 해보는 걸 좋아하고 (높은 개방성), 다수보다는 소수의 모임을 좋아하고 (낮은 외향성), 일이 뜻대로 안되면 불안해하거나 신경질적일 때가 있습니다 (높은 신경증). 성실성은… 스스로 성실한 편이라고 생각하는데, 정리정돈은 잘 하지 않아서 어중간한 값이 나오지 않았나 싶습니다.
마지막 Dark Triad (어둠의 3요소) 는 아마 처음 보실텐데, 얼마나 자기중심적이고 남의 말에 공감하기 어려워하는지를 측정합니다. 저도 원래는 이 심리 지표를 몰랐는데, 소위 ‘나쁜 남자’가 여성에게 매력적이라는 것을 보였다고 주장하는 이 (영어) 논문을 최근에 접하고 궁금해서 측정해봤습니다. 결과는:
나르시시즘 (자기애)와 Psychopathy (얼마나 반사회적인지, 남의 감정에 공감을 못하는지) 측면에서 저는 전체 인구의 하위 20%였습니다. ‘나쁜 남자’의 문턱에도 못 미치는 것이죠. 그래서 제가 뭇 여성에게 인기 폭☆발은 아닌가봅니다.
이상으로 제가 어떤 사람인지를 간단하게 소개했는데, 이런 사람이 [우리말 겨루기]에는 왜 출연해야겠다고 결심했을까요?
왜 시작했는가?
[우리말 겨루기]에 나가겠다고 마음을 먹은 것은 2019년 11월 30일의 일입니다. 제 일기는 결심의 순간을 이렇게 기록하고 있습니다:
어제 침대에서 뒹굴거리면서 책을 읽다가 문득 “아, TV에 나가야겠다. 그러면 재밌겠다.” 라는 생각이 들었다. (중략) 아무튼 뭔가 인생의 작은 목표가 생긴 것 같아 좋았다.
2019년 12월 01일 일기
TV에 나가는 건 아주 어릴 때 저의 소원이었습니다. 왜 그랬는지는 도통 모르겠습니다. “텔레비전에~ 내가 나왔으면~ 정말 좋겠네~” 동요를 너무 많이 들은 탓일까요? 아무튼 어릴 때 꿈을 이룬다고 생각하니 조금 신났습니다.
정량적으로 [우리말 겨루기]를 분석하기로 마음을 먹은 건, 제 기억에 따르면 저 생각이 들 때부터였습니다. 먼 예전에 [우리말 겨루기]를 보면서 n점을 앞서면 이길 확률이 몇 퍼센트일까? 가 궁금했습니다. TV에 나오고 싶다는 소원을 떠올렸을 때, [우리말 겨루기]가 먼저 떠오른 건 그런 기억 때문이기도 했습니다.
이렇게 다소 뜬금없는 생각을 올해 열심히 붙들어 750시간을 투자한 끝에 좋은 성과를 얻을 수 있었습니다. 이렇게 준비하는 과정에서 다양한 것을 느끼고 조금이나마 인간으로서 성장할 수 있었습니다.
느끼고 성장한 바
제가 [우리말 겨루기] 준비를 하면서 제일 많이 느낀 건 분석보다도 ‘노력의 힘’이었습니다. [우리말 겨루기]는 문제 출제 범위가 [표준국어대사전]으로 정해져 있어 분석이 가능했고, 문제 출제 경향이 일정하기 때문에 노력을 할수록 좋은 점수를 얻는 것이 피부로 체감이 되었습니다.
지금 제 인생의 많은 부분은 이렇게 직접적인 피드백이 없어 의욕이 있다가도 금방 사그러들기도 하는데, 다시 ‘하면 된다’를 느끼니 새삼 열심히 살고 싶어졌습니다. 원래는 ‘지성이면 감천이다’ 유의 말을 무척 싫어했지만, 일이 이렇게 풀리고 나니 조금은 진짜 같기도 합니다.
이렇게 노력의 효과를 직접 느꼈기 때문인지, 꽤 예전부터 조금 있었던 자기 혐오가 많이 줄었습니다. 이것저것 손대고 많이 노력하면서도 “이렇게 노력해봐야 누가 알아주냐?”며 스스로에게 조소를 짓는 경우가 많았습니다. (특히 이 블로그에 올라갈 도표를 보기 좋게 꾸밀 때, ‘아무도 안 보는 걸 왜 열심히 하냐?’는 생각이 많이 들었죠.) 그런데 제 노력을 PD/작가분들이 알아주시니 감사하기도 하고, 제 노력의 결과로 높은 점수를 얻고 나니 그런 염세적인 마음이 줄었습니다.
자기혐오가 줄고 전보다 건강한 마음을 가진 건 [우리말 겨루기]를 준비하는 과정에서 더 건강한 생활 습관들 들이려고 노력했기 때문이기도 합니다. 예상 촬영일 대략 100일 전부터 조깅을 시작하고, 일정한 시간에 자고 일어나며, 공부를 규칙적으로 하기 위해 노력했습니다. 특히 소홀히 했던 운동을 하니 정신이 맑아져 준비의 긴장과 스트레스를 해소할 수 있었습니다.
준비하는 과정이 마냥 행복하지는 않았습니다. 특히 단어를 외우는 과정은 고통스러웠죠. 저는 매일 제가 얼마나 행복한지를 측정하는데, 제가 올해 평균적으로 제일 불행했던 시간이 제가 [우리말 겨루기] 단어를 집중적으로 공부했던 시간과 일치합니다.
그렇지만 다 끝나고 생각해보니, 역시 하길 잘했다는 생각입니다. 열심히 준비한 과정이 뿌듯하기도 하고, 학교에서 열심히 갈고 닦은 코딩 실력을 이렇게 써먹는 것이 재밌었습니다. 무엇보다 20대에 오래도록 남을 추억을 만들어서 기분이 좋습니다.
이후 계획
이처럼 저에겐 [우리말 겨루기] 준비가 재밌었기 때문에, 내년에도 소소하게 무언가를 해볼까 합니다. 올해는 하루 평균 2시간을 [우리말 겨루기] 준비에 썼는데, 내년에는 하루에 1시간 정도만 투자하고 외우는 걸 하지 않아도 되는 프로젝트를 하면 어떨까 생각하고 있습니다. 제가 관심이 있는 순서대로:
수능 문제 예측
(특정 게임을 골라) 인게임 효율 분석
2022년 대선/지방선거 결과 예측 모델 개발
평범한 예체능 취미 (사진, 악기, 목공예)
체스
꼭 내년이 되지 않더라도, 언젠가 재밌는 일을 또 해서 여러분에게 소식을 전했으면 좋겠습니다.
감사의 말
저는 대략 750시간을 이 프로젝트에 투자했습니다. 절대 다수의 시간은 혼자의 노력으로 보냈지만, 몇몇 순간은 주변의 소중한 분들이 빛내주셨습니다. 덕분에 외롭지 않게 유종의 미를 거둘 수 있었습니다. 이 자리를 빌어 제 감사를 표합니다. 개인 정보를 유출하지 않기 위해 초성만 기록합니다. 당사자는 알 수 있으리라 생각합니다.
먼저 제 프로젝트를 흔쾌히 이해해주신 부모님과 지도교수님께 감사의 말씀 드립니다. 제가 본업이 아닌 일을 한다고 했음에도, 제가 본업을 잃어버리지 않으리라 믿어주셨기에 가능했던 일입니다. 저를 믿어주고 응원해주셔서 감사합니다.
저를 좋게 봐주시어 예선을 통과시켜주시고 방송에도 제 웹사이트를 띄워주신 [우리말 겨루기] 제작진께 감사드립니다. 여러분의 노력이 없었다면 이 프로젝트도, 이 경험도 없었겠죠. 더불어 저와 같은 회차에서 우리말을 겨뤄주시고, 승부가 결정되고 나서는 응원해주신 다른 참가자분들께 감사드립니다.
제 [우리말 겨루기] 시뮬레이션을 도와준 ㅎㅅ, ㅈㅇ, ㅎㅈ, ㅊㅇ, ㅇㅈ, ㅅㅇ에게 감사를 표합니다. 시뮬레이션을 통해 제 실력을 측정하고 앞으로 무엇을 공부해야 할지 판단할 수 있었습니다. 여러분이 저를 도와주지 않았다면 제가 이렇게 좋은 성적을 얻지 못했으리라 장담합니다. 특히 대부분의 시뮬레이션을 도와준 ㅎㅅ에게 감사드립니다.
다소 뜬금없는 [우리말 겨루기] 얘기를 듣고도 저를 지지해준 많은 친구에게 감사드립니다. 특히 제 통계에 관심을 가지고, 재미없기 쉬운 얘기를 끝까지 들어주고 피드백까지 해준 ㅎㅅ, ㅅㅇ, ㅇㅅ, ㄷㅇ, ㅈㅇ에게 감사드립니다. (혹시 제가 얘기를 안 했어도 너무 서운해하지는 않았으면 좋겠습니다. 이 프로젝트를 꽤 오랫동안 비밀로 해서 잘 말하지 않았습니다.)
제 글을 읽고 피드백을 주신 (ㅇㅅ, ㅈㅎ, ㅎㅈ)에게 감사드립니다. 제가 글솜씨가 없어 처음에는 이 글이 엉망진창이었는데, 여러분이 친절한 조언을 해주신 덕분에 나은 글을 올릴 수 있었습니다.
[우리말 겨루기] 준비 과정은 1월부터 촬영일인 11월 10일까지, 대략 열 달 반이었습니다. 제 준비 과정을 분기별로 살펴보겠습니다.
1분기에는 공부를 많이 하지는 않고, 데이터를 모으고 분석하는 데 힘썼습니다. 데이터는 wavve 플랫폼에 있는 [우리말 겨루기] 방영분을 직접 보고 문제를 엑셀에 정리하여 총 217회분(4.5년 어치)에 대한 정보를 모았습니다. wavve 플랫폼에는 2015년 3월 방송부터 있지만, 데이터를 모으는 게 너무 힘들어서 2015년 7월 데이터까지만 모았습니다.
데이터를 모으는 중에 예심에 들락거려보았습니다. 1월 예심은 제가 교통 문제로 예심 장소에 5분 늦게 도착해서 참여하지 못했습니다. 2월 예심에서는 ‘오늘은 떨어져야지!’ 하는 마음으로 가볍게 봤는데, 생각보다 문제가 잘 풀려서 합격하고 말았습니다. 예심을 여러 번 보면서 “예심에서 낮은 점수를 받으면 낮은 점수를 받는 사람들과 경쟁하게 될까?” 하는 문제에 대한 답을 찾고 싶었는데, 예심을 봐보니 다른 사람의 점수를 알 수 있는 구조가 아닌 것 같아 한 번에 합격한 것이 지금은 다행이라 생각합니다.
1월과 2월에 [표준국어대사전] 전산자료를 받아, [우리말 겨루기] 문제는 주로 어디서 출제되는지 분석했습니다. [표준국어대사전]과 함께 국립국어원에서 2005년에 펴낸 현대 국어 사용 빈도 조사 2를 활용했는데, 제 분석에 특히 도움이 많이 되었습니다. [표준국어대사전]이 알려주는 품사와 고유어 여부, 그리고 단어 사용 빈도를 통해 어떤 단어를 공부해야 하는지 우선순위를 정했습니다.
분석의 결과를 바탕으로 3월에는 단어의 뜻을 보고 단어를 알아맞히는 암기를 시작해보았지만, [표준국어대사전]에서 바로 공부자료를 만드는 것은 생각보다 어려운 일이어서 시행착오를 조금 겪었습니다. 공부를 두 번 해보다가 엎고, 결국 4월 초부터 본격적으로 암기를 시작했습니다. 이 때부터 공부할 시간을 못 박아두고 (21:30~00:00) 공부했는데, 그렇게 공부를 습관으로 만드니 공부를 시작하기 위해 큰 의지가 필요하지 않아 좋았습니다.
그림에 쓴 “시뮬레이션”에서는 ‘내가 오늘 당장 방송에 나갔으면 몇 점을 얻었을까?’에 대한 답을 얻고자 했습니다. 이를 위해 다른 친구에게 최신 [우리말 겨루기] 방송을 보고 문제를 ppt에 적은 뒤, 저에게 문제를 보여주고 제가 그 중에 몇 개를 맞히고 틀리는지를 따져 예상 점수를 계산했습니다. 공부를 전혀 하지 않은 2월, 비유적인 표현을 조금 했던 3월에 각각 한 번씩 했는데, 3월 시뮬레이션에서 기출 문제가 많이 나온다는 것을 체감하고 공부 전략을 수정했습니다. 한편 시뮬레이션을 해보니 공부한 단어는 웬만하면 빠르게 인지하고 맞힐 수 있음을 확인해서, 단어를 외우는 방법은 유효하다고 판단하고 유지했습니다.
2분기에는 주로 기출문제를 공부했는데, 새로운 문제는 하루에 100개씩 공부하고, 봤던 문제를 하루에 약 700개씩 복습했습니다. 분석 결과에 따르면 기출 문제를 모두 공부하면 출연해서 얻는 점수의 기댓값이 961점, 대략 5일 공부할 때마다 기대 점수가 약 100점 올라서 동기부여가 쉬웠습니다. 6월부터는 공부를 해도 기대 점수가 전처럼 팍팍 오르지는 않았지만, 최종 점수와 우승 확률의 상관관계에 대한 분석을 바탕으로 “오늘 공부해서 우승 확률이 2%p 올랐다”와 같이 생각하며 마음을 다스렸습니다.
5월 말에 기출 공부를 마무리했는데, 마무리짓기 전 5월 초에 기출을 모두 공부하고 무엇을 공부해야 하는지 다시 분석했습니다. 2, 3월에는 어떤 문제가 나오는지에 대한 별다른 감이 없이 [표준국어대사전]에 있는 모든 단어 (내지는 빈도가 1 이상인 모든 단어)에 대한 추세를 분석했지만, 5월에는 기출 문제를 상당히 공부한 상태에서 “이런 문제가 많이 나오는 거 같은데…”와 같은 가설이 많이 생겼고, 통계적으로 그런 가설을 분석하고 공부 전략을 다시 세웠습니다.
기출 문제를 모두 공부하고 시뮬레이션을 해보았는데, 당시 제 기댓값 점수와 거의 맞아떨어져서 제 전략이 먹히고 있다고 생각했습니다. 기출 공부의 다른 장점 역시 느꼈는데, 실제로 공부하지 않은 단어라고 하더라도 기출 문제를 공부하면서 생기는 감으로 맞힐 수 있는 단어가 늘었습니다.
3분기에는 사용 빈도가 높은 단어를 위주로 공부했습니다. 이 공부가 거의 끝났을 8월 중순에 시뮬레이션을 해보았는데, 2450점 이라는 엄청난 점수가 나왔습니다. 2450점을 얻으면 제 분석상 도저히 질 수가 없었는데, 예상 촬영일까지 3달이 남은 시점에서 이기는 것이 확실하다고 생각하니 마음이 해이해져 공부에 대한 동기부여가 조금 약해졌습니다.
별도로 7월에 달인3 문제를 분석했는데, 그 때까지 나왔던 4개의 달인3 문제에가 만족하는 여러 조건을 앞으로의 문제도 만족하면 달인3을 맞히는 데 약 5700개의 단어만 공부하면 된다는 결론이 났습니다. 그 정도 숫자면 덤벼볼 만하다고 생각했지만 9월에 출제된 달인3 문제가 분석한 경향에서 빗나가면서 달인3 문제에 대한 체계적인 공부는 포기했습니다.
9월에는 달인1 기출문제 1200개를 하루에 100개씩 빠르게 공부했습니다. 관용구를 새로 열심히 공부하려고도 했지만, 관용구를 외우는 것이 단어를 외우는 것보다 훨씬 고통스러워 오래가지 못했습니다. 9월 중순 이후로는 개인적으로 시간 소모가 심한 일이 생겨 10월 말에 제작진으로부터 연락을 받을 때까지 새로운 공부를 하지 못했습니다. (그래서 사실상 6달 정도 공부한 것이죠.) 잠깐 짬을 내어 십자말풀이판 위치에 따른 문제 유형을 분석했는데, 대체로 결과가 제 직관과 들어맞았습니다.
10월 말부터 한글 맞춤법을 슬슬 공부하다가, 10월 28일에 제작진으로부터 11월 10일에 출연이 가능하겠느냐는 연락을 받았습니다. 그 때부터 공부에 다시 불이 붙어 한글 맞춤법 66개조를 빨리 공부했습니다.
11월 1일에는 [우리말 겨루기] 3회분 내용으로 최종 시뮬레이션을 진행했습니다. 지금까지 시뮬레이션은 저와 진행자만 있었다면, 최종 시뮬레이션에서는 경쟁자를 해줄 친구를 모아놓고 tv에서 문제 제시부터 누름단추를 누를 때까지의 시간을 측정해 따라하게 하는 등 최대한 실제와 같은 상황을 연출했습니다. 최종 시뮬레이션에서 보정한 평균 1608점, 최종 우승 확률은 87%라고 계산했습니다. (한편 최종 시뮬레이션에서는 2500점에 가까운 점수도 나오지 않아서, 제가 이번 출연에서 운이 좋았음을 알 수 있죠.) 세 번의 시뮬레이션에서 달인1 문제를 모두 통과했기 때문에, 달인1 통과 확률이 80~90%로 높다고 자신했습니다.
출연 전 주에는 공부했던 기출 문제 중 정답을 5초 내에 맞히지 못한 문제, 겹낱말, 관용구를 벼락치기했습니다. 분석 결과에 따르면 첫소리 기출문제를 푸는 것은 굉장히 효율이 낮아 피했지만, 촬영 당일에는 긴장을 풀기 위해 첫소리 기출 문제를 벼락치기했습니다. KBS에 도착해 촬영 준비를 하면서는 순우리말+겹낱말+비유적인 표현에 해당하는 약 500개의 단어를 벼락치기했습니다. (그 가운데 제가 방송에서 맞힌 “이슬빛”이 있었죠.)
성공의 비결
방송은 아마 제 분석에 초점이 맞춰져 있겠지만, 분석만으로 [우리말 겨루기]에서 이길 수는 없었습니다. 제가 생각하기에 제가 높은 성적을 거둔 이유는 글머리에 강조했듯 많은 노력을 최대한 효과적으로 기울였기 때문입니다. 아무리 ‘이렇게만 공부하면 된다’는 지침이 있어도, 공부를 하지 않으면 아무런 의미가 없죠. 저는 기억력이 좋은 편도 아니라 (어떤 단어는 53번까지도 복습했습니다) 많은 노력이 특히 중요했습니다.
외우는 방법
다른 사람들은 이른바 적바림을 통해 공부한다고 하는데… 기억력이 요구되는 공부는 특히 복습이 중요하다고 생각해서, 물리적인 노력이 많이 들어가는 방법은 쓰고 싶지 않았습니다. 대신 비교적 과학적 근거가 있는 Spaced Repetition과 Mnemonics를 주로 이용하여 공부를 했습니다. Mind Palace도 써 보려고는 했는데 효과를 보지 못했습니다.
Spaced Repetition
Spaced Repetition은 수많은 문제에 대한 정답을 외우는 데 도움을 주는 공부법입니다. 이 공부법의 핵심은 능동적인 복습과 학습 난이도에 따라 조절되는 복습 기간입니다. 이 두 가지 복습 원칙을 통해 최대한 효율적으로 많은 지식을 머릿속에 욱여넣을 수 있습니다.
능동적인 복습은, 책을 훑어보면서 “음, 그렇지.”하고 있는 지식을 수동적으로 복습하기보다는 능동적으로 문제를 보고 답하려고 할 때 지식이 머릿속에 잘 보존된다는 연구 결과에 기초합니다. 그래서 Spaced Repetition으로 공부한 저는, 매일 약 800개의 문제를 보고 답하는 훈련을 했습니다. 아래 그림의 왼쪽을 보고, “비지떡!”을 머릿속으로 떠올리고, 정답을 확인하는 식입니다.
이 경우에는 제가 무사히 맞혔습니다. 그런데 제가 기억을 못하거나 틀리는 문제도 있겠죠? 이런 경우에는 그 날 다시 복습하고, 복습의 주기가 짧아집니다. 반면 제가 연속해서 맞힌 문제는 복습 간격이 점점 길어져, 길면 1~2년동안 다시 복습하지 않아도 됩니다. 그만큼 기억에 오래 남아있기 때문이죠. 이것이 학습 난이도에 따라 조절되는 복습 기간입니다.
저는 Spaced Repetition 앱 중에 Anki를 사용하여 공부했습니다. 기본 세팅을 사용하면 공부한 모든 지식의 약 90%를 장기기억에 유지시킬 수 있습니다. Anki로 꾸준히 복습을 했던 덕분에, 4-5월에 집중적으로 공부한 기출 문제를 6달 뒤인 11월까지 안정적으로 맞힐 수 있었습니다.
Mnemonics
Mnemonics는 기본적으로 외우기 어려운 사실을 외우기 쉬운 사실로 변환해서 기억하는 공부법입니다. 예를 들어서 각 달에 며칠이 있는지를 외울 때 손가락을 펼쳐서 따져보곤 하죠. 단어를 외우다보니 서로 헷갈리거나, 너무 흔한 뜻이라 기억하기 쉽지 않은 경우가 많았는데, 특히 어려운 단어는 뜻풀이의 첫 음절들을 따서 외우는 공식을 만들곤 했습니다. 가령 단어 ‘얼마간’은 뜻이:
그리 많지 아니한 수량이나 정도.
인데 여기서 ‘그많아수’ → ‘그만수’ → ‘그 만수르’ → ‘그 만수르가 얼마냐고 물어봤다고?!” 라는 저에게 기억하기 쉬운 문장으로 만들어서 외웠습니다. 이 방법은 Spaced Repetition보다는 덜 체계적인 공부법이지만, 많은 단어를 기억하기 쉽게 했습니다.
Oh man! I’m writing this on the day I won the show. I just had a satisfying meal, a warm bath, and a sip of wine with some delicious cheese and grapes. Honestly I don’t know if I’ve ever been so happy.
In light of my statistics-fueled victory, I find the following music appropriate to the tone of the remainder of this essay. (caution: contains profanity)
Why English
I did participate in a Korean show about the Korean language, but when it comes to writing I am more comfortable with English. Hence I started with this text and worked it back into the Korean version. I also wrote slightly more personal content here and got a little more wonky, so English seemed to be an appropriate barrier.
Me, from the inside
Since you saw what I look like on the outside on TV, I thought it would be fun to give you the full picture and show you what I look like on the inside, in the form of personality tests. The results of three tests are presented: MBTI, Big Five, and Dark Triad. While the Big-Five personality test seems to be the standard personality test for personality researchers, for whatever reason MBTI is popular in Korea; I wanted to make my results more interpretable to the Koreans reading this. Note that these results are from self-reported surveys, so they measure how I view myself, as opposed to how others view me. I have noticed that those two sometimes diverge significantly, so take these results with a grain of salt. These tests were done on the weekend before I went on the show, so that they would not be affected by any short-term psychological effects of my winning or losing.
The thing I don’t like about MBTI is perhaps what makes it appealing: it is discrete. As you can see, outside of being strongly introverted, on the other 3 main categories I am close to neutral. Hence it wouldn’t be strange if my categorization were INFJ or INTP or so on; yet I get a certain ISTJ. (I talked with the producers of the show today and they said I was definitely an ISTJ; go figure.) By the way, this site uses the Big Five personality traits as its fundamentals! It’s not actually MBTI! But whatever.
I think this provides a better view of who I am: I am curious about a lot of things (high openness); I… am fine being alone, but in general like being in small groups (of 2-3 people) and dislike being in large and noisy groups (low extraversion); I do my best to never show it, but I can be negative and critical (high negative emotionality).
Next, Dark Triad. This is a really lesser-known one, but this paper (showing that dark and evil guys are rated as attractive by girls) caught my attention, so I wanted to give it a shot. I took the test here:
Oops, I’m not a dark and evil guy, maybe that’s why I’m not super popular. Well, I guess if you’re not romantically interested in me, you can think I’m a good person?
Lifestyle
I modified my lifestyle in some ways to perform better on the show, and I wanted to document it / show my effort off. (Also I wanted to show off some of the data I gather about myself.)
Jogging
Starting at July 7th morning, I started jogging in the morning, following the NHS Couch to 5k plan. The reason I went with jogging is primarily because of this Wikipedia article about the neurobiological benefits of aerobic exercise: it explains that “people who regularly perform aerobic exercise have greater scores on … declarative memory …”, and declarative memory is exactly what I wanted to improve.
Over the course of about 80 days I completed the Couch to 5k plan; regardless of the memory improvement, it felt good to improve my physical ability. It certainly felt like my memory was better after exercising, but that might be placebo in effect. Because of the strong subjective feeling that exercising was good, I kept on running for 30 minutes three times a week until the day of the show. After the show… you can probably guess.
Time
Starting from this April, I keep track of where I use my time with a 30-minute resolution. There are many interesting things you can do with this; one is to analyze my sleep pattern before and after the show event. Since Sep. 1st until the day I took the show (Nov. 10th) I generally tried to sleep at midnight and wake up at 07:30. After the show, I didn’t put any restriction on myself and just did whatever I wanted. (…Obviously while doing my best not to interfere with my main job, being a Ph.D. candidate. Love you Prof!) So how much did my sleep pattern change?
…Yeah, there is a ~1 hour shift, but it’s not that drastic, is it. Honestly I thought I could show you a really drastic graph where in September and October I sleep like some kind of monk but after the show I sleep like an extroverted undergrad, but my life is much more stable than I give it credit.
Since I have this data, I have a relatively accurate estimate of how much time I sunk into this project since April: 602.5 hours. Here is a month-by-month graph of time use:
Here, we can see that while the overall time I put in the project steadily decreased, my memorization time mostly stayed stable from April to August. After that I had a personal issue that limited my time investment in this project, but I kept on doing the Anki-prescribed reviews. The uptick of analysis in November is partly because I did some 벼락치기 analysis before the show, and partly because I continued to put in time in these analysis essays after the show.
Happiness
Since 2019, I have been keeping track of my happiness 4 times each day, on a 1-7 Likert scale. The data has many caveats but I won’t bore you with those, let’s just accept the data as is. The question is, was I happier this year since I had the [우리말 겨루기] goal? Obviously there are a trillion confounding factors, but let’s just compare the average happiness of 2019 to 2020:
Can you see which year was happier? The answer is 2020; I was happier by 0.031 points. That kind of tiny difference could be upended by a few good or bad days on either year. So somewhat surprisingly, I wasn’t actually significantly more happy this year despite having this project in my life.
Since I report my happiness at random times of the day, I can also look at happiness by time of day. Here is the graph:
The peak at 12 o’clock is… lunch. (I really like eating.) I usually studied [우리말 겨루기] at 9~11 pm; you can see how I was at my worst mood at 9 and 10 o’clock, then I get much happier at 11, when my studies end. I apparently hated studying, funny. Maybe that’s why I wasn’t happier this year.
What’s next
I had fun this time preparing for [우리말 겨루기], and I am looking for things to do next. I want to use less than one hour a day for the next project, since I have to gear up on my real job, research; I’ve come up with a few things:
Let’s get this one out of the way: “normal” hobbies. For example, taking pictures, learning a musical instrument, trying carpentry, and so on. This is completely fine with me. I’m not really a hell-bent statistician; I just tend to like doing things that I am good at. This path very likely would make me no money, and the amount of fun would vary a lot based on what I choose to do and how compatible it is with me.
Next on the list is 2022 (Korean) Election Prediction, in which I would develop a model to predict who would become president and which party would win the municipal elections. I would be mostly following FiveThirtyEight here. Actually I did a small-scale project like this back in 2018, where me and my team got the municipal election results right for every 광역자치단체장 race. That model was flawed though and not publicized enough. This time, I think I could do much better both in statistical modelling and spreading the word about the model. This seems to be less fun on average; gathering data would be a real chore, and I’m not incredibly interested in Korean politics right now. I think if I make something that works though, there are many routes to monetization in this case.
Next is to be a game YouTuber that does quantitative analysis, a la Spirit Of The Law. This would be fun, and I wouldn’t fail, so to say, because the analysis wouldn’t be as difficult as election prediction for example. But the amount of money I would make would be subject to a lot of luck. Being a successful YouTuber might take more than 1 hour/day, which is another concern.
The last one is 수능 prediction. There are some direct parallels to my [우리말 겨루기] project: In both I predict what kinds of questions are more likely to come out; in both there is historic data that spans years that I can use for statistical analysis; in both, I start off with the belief that I have a comparative advantage because I doubt people have tried the statistical toolset. There are also some clear differences that might make this project difficult: making 수능 prediction results useful would be a non-trivial task, especially when trying to benefit myself (since it’s not me who would use the results); evaluation of how well I did in prediction may also not be well-defined. But if I succeed by some measure, I think this would make me the most money of any of these projects.
Influences
FiveThirtyEight,[The Big Short], [Moneyball], [Superforecasters]: These four items are listed in the order I got in contact with them, probably. Their common denominator is that they all involve statistic geek(s) who use data to see what other people failed to see. That’s so cool, you know? So yeah, I was definitely influenced by work like this, because I wanted to be someone as cool as that.
Gwern: Have you seen this guy’s site? Gwern’s cautiousness with statistics makes my website look like some kindergartener’s picture. I read a of lot of Gwern’s posts last year (starting with the tank post) and the use of statistics and scientific experiments to improve one’s life was interesting (e.g. the LSD microdosing post).
Money Stuff: Matt’s columns are the best; I often read them while having lunch. He often talks about weird financial products, which also inspired me to think of something intelligent that I could do. I probably read his columns from late 2018; I loved every single one about We (this one is a classic), I also liked getting introduced to weird news that I would have never seen, like this one about how the advent of online dating made dating itself more ‘efficient’, which in turn made everyone unhappy. Actually I just read the original paper for the online dating thing and it is really interesting! What is particularly interesting is the indirect evidence that dating has actually become more ‘efficient’: divorce rates are decreasing in the younger age group. If you didn’t know what kind of a person I am, now you know.
쓰레기 머학생: (Which I saw when it was in 베스트 도전) This is a funny and harmless webcomic that actually significantly nudged me towards this project. Back then I was a little depressed at the things I felt I couldn’t do; the protagonist of the comic felt that she was socially isolated but tried to construct a satisfactory life by doing things she could do and she liked. I felt that she was somewhat similar to me, and that gave me some hope that I could construct a satisfactory life too. More importantly, instead of looking at the things I couldn’t do, I tried to look at the things I could do; [우리말 겨루기] felt like one of them.
Regrets
I wish I had come off as more of a nerd on the show. On TV, I wimped out, simply going “metaphoric phrases are more efficient”, like a normal person. Instead, I should have said, “Metaphoric phrases actually have a study efficiency of about 0.2 points per word studied; that is ~5 times more efficient than more efficient than the average word we know, and ~30 times more efficient than a random word on the dictionary”. Or, “I want to do a non-competitive question; my research indicates that words that overlap with 자물쇠 문제 are ~80% 쓰기 문제”. You know? Despite imagining myself doing stupid stuff like that all year, I was woefully underprepared for the actual interview. I should have honed my nerdy lines in my simulations, but those were almost exclusively focused on evaluating my problem-solving skills.
A problem I noticed about my analysis, far into my studies when it was too late, was that I should have examined which (meaning, word) pairs come out, instead of which words come out on the show. That might have reduced my study quantity, and allowed me to study common-but-with-a-bazillion-meaning words, thus increasing my study efficiency. I guess I hope someone else does better analysis than me in the future?
I small regret that I have, since I didn’t get the 달인 in the end, is maybe I could have worked harder. But probably not. I wasn’t really in the mental state to do anything more for [우리말 겨루기] most of this year. Honestly I feel that this amount of effort is a lot, given my environment.
Acknowledgements
From data gathering to analysis to visualization to actually memorizing the questions, this was clearly a one-man project, but without the help and support of my peers I would not have been able to complete it. I would like to properly acknowledge the help I got on the way, and celebrate the social ties which facilitated the effort.
First of all, thanks to my parents and my advisor for being amused with this project and generally supportive. If either of them disapproved this side project, well… I would have done it anyway, but I wouldn’t feel so good about it. I am grateful for their understanding. I should also thank my labmates for their understanding here. None of them freaked out saying “well you should have kept that energy for research”; instead they were all supportive of my effort. Now to be honest I wasn’t 100% open about how much effort I put into this project; but they are good people, I don’t think they will get mad at me. (I hope.)
Thanks to H, J, H, C, W, and S for helping me with my simulation efforts. Simulations helped me identify how well I was doing, how much more I should do, and perhaps most importantly how stochastic the final score can be. Special thanks to H.C., who helped me with most simulations. Thanks to H for being particularly amused by this project, and motivating me to work harder. I deeply regret forgetting to take a picture of the last simulation; you guys are the best.
I wish I could enumerate all the friends I talked about this to, but I’m sure I would omit someone by mistake, and I don’t want anyone to be hurt. If I told you about this project in advance, I want to thank you for being nice to me: I never met any negative response about this project, and I am grateful for having such supportive friends. Special thanks to H, S, Y, D, and J for taking enough interest to listen to details about my analysis (which includes bearing my rants about statistics), and even providing feedback.
Thanks to W, T, and H for jogging with me. I can’t measure how much jogging helped my effort here, but it certainly kept me mentally stable, and I’m thankful to these friends who helped me stay motivated to jog.
Thanks to my parents, my labmates, H & T, S & C & H for taking 응원 영상 for me; they used some of their time to make these videos, and I would like to express my gratitude for them making that effort.
Thanks to the [우리말 겨루기] producers, for letting me be on their wonderful show and for taking interest in my website and analysis. One person, I don’t know her name, specifically noted the crowns I put on the winners and complemented me for that. As a person who loves hiding and finding details like that, I felt a particular satisfaction from that comment.
Finally, thanks to myself, for being willing to put 700+ hours in this project to achieve a childhood goal in a spectacular way. I don’t think I could have done much better, and I want to applaud myself for doing my best.
몇 점을 얻어야 [우리말 겨루기]에서 1등을 안정적으로 할 수 있을까? 이 질문은 특히 우리말 달인을 하기 위해 공부하는 사람들에게 중요하다. 필자가 느끼기에는 1등을 하기 위해 필요한 공부보다는, 달인이 되기 위해 필요한 공부가 압도적으로 많다. 그러나 달인이 되려면 반드시 1등을 해야 하므로, 달인이 목표라면 1등이 되기 위한 공부는 정확히 필요한 만큼만 하고 달인 문제 공부에 집중하는 것이 바람직하다.
1등이 되려면 몇 점을 얻어야 하는가는, 1등이 일반적으로 몇 점을 얻는가 하는 문제와는 미묘하게 다르다. 1등을 하는 사람 중에는 안정적으로 1등을 하기 위한 점수를 훌쩍 넘기는 사람도 있기 때문이다. 다시 명확히 말하면, 우리가 답을 얻고자 하는 문제는, “이길 확률을 90%로 만들려면 최소한 몇 점을 안정적으로 얻을 수 있어야 할까?” 하는 문제이지 “1등 상위 90%는 몇 점을 얻을까?” 하는 문제와는 다르다.
구하는 값을 정확히 정의해보자. 전체 참가자 집합을 , 각 참가자의 최종 점수를 구하는 함수 , 그리고 n등을 한 참가자를 원소로 갖는 집합 를 두자. 다음으로, 특정 점수를 가진 사람들의 집합을 정의한다:
는 ‘라는 최종 점수를 가진 참가자의 집합’을 가리킨다. s는 노이즈를 줄이기 위해 도입한 변수인데, s가 클수록 의 범위가 넓어져 더 많은 데이터를 포함하는 대신, 함수가 자체에는 민감하게 바뀌지 못한다.
이러한 정의를 바탕으로 점수 점을 받았을 때, n등을 할 확률을 구할 수 있다. 식은 아래와 같다.
위 공식을 바탕으로, 2018년과 2019년 참가자들의 데이터를 이용해 특정 최종 점수를 얻었을 때 1등을 할 확률을 구했다.
이 그래프를 읽기 위해서는, 예상 점수나 목표 확률을 잡는 것이 편하다. 가령 예상 점수가 1500점이라고 하자. 그래프를 에서 자른 단면은 80% 빨강, 20% 초록이다. 그러면 1등을 할 확률이 대략 80%, 2등을 할 확률이 20%이다. 한편, 1등을 할 확률이 60% 이상이 될 만큼의 점수가 궁금하다고 하자. 그래프를 에서 다른 단면이 빨강과 처음 만나는 지점은 대략 이다. 따라서 이길 확률을 60% 이상이 되게 하려면, 점수를 1350점 이상 얻어야 한다고 그래프를 읽을 수 있다.
다시 말하지만 이것은 일반적인 1등이 몇 점을 얻는가 하는 문제와는 다르다. (1등의 중앙값으로 정의된) 상위 50% 1등의 일반적인 점수는 1600점이지만, 50%의 확률로 1등을 하기 위해서는 약 1300점만 득점하면 된다.
2020년 11월 1일 (촬영일 D-9)에 친구 4명을 모아 한 명은 진행자, 나머지 셋과 나를 가상의 참여자로 삼아 [우리말 겨루기] 최근 3개 회차(825, 830, 831회)의 문제를 함께 풀어보았다. 목적은 나의 현재 약점과 강점을 알아내 다음 일주일간 공부할 내용을 결정하는 것, 그리고 경쟁자가 있는 상황에서 내가 얻는 점수가 얼마나 바뀌는지 측정하고, 출연해 이길 확률을 계산하는 것에 있었다. 다음 세 가지 설정에서 문제를 풀었다:
몸풀기 (825회): 모든 참가자에게 정답을 알려주지 않고 함께 문제를 풀었다.
실전 (831회): 나를 제외한 참가자들에게 정답을 알려주되 TV에서 질문이 시작되고 나서 참가자가 버저를 누를 때까지의 시간을 측정하여 그 시간에 맞게 대답하게끔 했다.
대조군 (830회): 이전 시뮬레이션과 마찬가지로 경쟁 없이 혼자 문제를 풀었다.
최대한 실제와 비슷한 상황을 만들기 위해, 이전 시뮬레이션과 달리 촬영 중 일어날 수 있는 식곤증의 효과를 살펴보기 위해 시뮬레이션을 점심 식사 30분에 진행하고, 카메라 앞에서 일어날 수 있는 긴장의 효과를 내기 위해 커피를 2잔 마셨다. (나는 커피에 약해 평소에는 먹지 않는다.)
점수 결과와 승리 확률 계산
경쟁으로 지식 대비 잃는 점수가 13%, 1등으로 마칠 확률은 87%
몸풀기에서 1950점, 실전에서 1450점, 대조군에서 2050점을 얻었다. 실전 편에서 경쟁이 없었다면 얻었을 점수는 1650점이었다. 따라서 경쟁 때문에 내가 실제로 가지는 지식 대비 내가 잃는 점수가 전체 점수의 약 (1650-1450)/1650=0.13이라고 예상했다. 이를 바탕으로 몸풀기/대조군 점수를 보정하여 예상 점수의 분포를 구했다. 1 이렇게 최종 점수의 분포와 점수별 승리 확률 자료를 종합해 최종 승리 확률을 계산했다. 점수 변수를 두면, 다음과 같이 1등의 marginal probability를 구할 수 있다:
여기서 가 시뮬레이션을 통해 구한 최종 점수의 분포, 는 최종 점수에 따른 1등 확률이다. 이렇게 최종 승리 확률 (약 8분의 7) 를 계산했다.
(첨언하자면 최종 점수를 바탕으로 승리 확률을 계산한 건 최선의 접근은 아니었다고 생각한다. 시간이 있었다면 참가자의 실력 분포를 이용하여 계산하는 편이 경쟁 때문에 잃는 점수를 더 잘 보정했으리라 생각한다. 다만 이 분석을 하는 시점에서는 그럴 시간이 없었다.)
문제 유형별 정답률 분석
아래 분석은 풀면서 머릿속에 정답이 떠올랐는지를 바탕으로 계산했으며, 실제로 경쟁을 뚫고 맞혔는지는 고려하지 않았다.
기출 가운데 ‘가운데’는 첫소리 문제로, ‘개이득’이라는 유행어가 머릿속에 맴도는 바람에 맞히지 못했다. ‘공치사’와 ‘뒤끝’은 기출 문제이기는 했으나 이전 출제와는 다른 뜻이 나와 맞히지 못했다. 따라서 기출 가운데 [우리말 겨루기] 출제와 다른 뜻이 있는 단어를 다시 공부하기로 했다.
사용 빈도가 높은 단어 중에는 ‘내뱉다’를 공부했으나 기억하지 못했다. 그런데 사용 빈도가 높은 단어는 분량이 방대한 반면에 복습했을 때 기대되는 점수 향상이 부족하다고 판단하여 복습하지 않기로 했다.
공부하지 않은 문제를 맞힐 확률은 33%로 계산했다.
문제 형식에 따른 정답률
첫소리/일반 문제/자물쇠 문제 등등에 대한 정답률은…?
Question Type 첫소리: 66.7% (8/12)
Question Type Normal: 60.5% (26/43)
Question Type 자물쇠: 60.0% (9/15)
Question Type 영상 쓰기: 75.0% (3/4)
Question Type 겹낱말: 0.0% (0/2)
Question Type 연상 쓰기 문제 (200): 100.0% (2/2)
Question Type 바른말 고르기: 0.0% (0/2)
Question Type 다듬은 우리말: 50.0% (1/2)
Question Type 또순이: 100.0% (2/2)
한 번만 나온 문제 유형은 제외하였다. 특별히 염두에 둔 부분은, 겹낱말/바른말 고르기 문제의 출제가 생각보다 잦고 내가 시뮬레이션에서 이런 유형의 문제를 전혀 맞히지 못했다는 점이다. 겹낱말 계열은 달인2 띄어쓰기 문제에서도 도움이 되므로, 흔한 고유어 명사의 겹낱말을 벼락치기 하기로 했다.
첫소리 문제의 정답률이 생각보다 낮았지만 (2/3), 초성 문제는 기출 문제 공부 효율이 굉장히 낮아 공부하지 않는 것이 바람직하다고 판단했다. (하지만 결국 불안함에 못 이겨 촬영일 당일 KBS로 가는 길에 첫소리 기출 문제를 벼락치기 했다.)
기타 분석 결론
틀린 고유어 가운데 겹낱말과 명사가 잦았다. 따라서 고유어 겹낱말 명사를 공부하는 것이 바람직하다는 단서를 더 얻었다.
구(속담/관용구)의 정답률은 33%로, 다른 문제 유형에 비해 낮았다. 따라서 관용구를 벼락치기 하기로 했다.
십자말풀이 판의 배치는 모든 참가자에게 보이지만, 각 문제가 어떤 유형인지는 참가자가 알 수 없다. 내 의지에 따라 내가 원하는 문제 유형을 고르기 위해, 십자말풀이 판의 규칙성을 정량적으로 분석했다.
2018-2019년 십자말풀이 판을 바탕으로 분석했다.
겹치는 글자 수에 따른 분석
십자말풀이 판을 보면 기본적으로 처음 배치에서 단어당 겹치는 글자의 숫자를 셀 수 있고, 문제를 풀어가며 겹치는 글자가 열린 문제를 풀 수도 있다. 따라서 문제마다 십자말풀이 판에 대한 정보를 2개의 숫자로 압축할 수 있는데, 하나는 “이 단어의 몇 글자가 다른 단어와 겹치는지”, 하나는 “이 문제가 열렸을 때 몇 글자나 공개되어 있었는지” 이다. 첫 번째를 “처음부터 겹침”을 줄여서 “처겹”, 두 번째를 “열렸을 때 보임”을 줄여서 “열보”라고 하자.
처겹과 열보에 대한 전체 통계는 아래와 같다.
처겹 히스토그램에서 볼 수 있듯 대부분의 단어는 단 한 지점에서 다른 단어와 겹친다. 반면 열보 히스토그램을 보면, 열렸을 때 보이는 글자 숫자는 0개가 반, 1개가 반 정도다.
처겹과 열보 정보를 바탕으로 문제 유형을 알아맞힐 수 있을까? 각 (처겹, 열보) 좌표에 따라서 문제 유형의 비율이 어떻게 바뀌는지 살펴보자. 아래 분석에서는 십자말풀이 판을 봤을 때 문제 유형이 당연한 첫소리, 자물쇠 문제는 제외하였다.
파이 그래프의 크기를 각 (처겹, 열보) 좌표에 해당하는 문제의 숫자에 비례하게 하되, 최소 크기보다는 작아지지 않게 했다. 파이 그래프를 잘 살펴보면, 처겹이 높아질수록 일반문제일 확률이 높아지고, 열보가 높아질수록 일반 문제일 확률이 높다. 따라서 다른 사람들의 실력을 쓰기 문제를 통해 손해 없이 알아내고 싶다면 처겹과 열보가 낮은 문제를, 일반 문제를 풀고 싶다면 처겹과 열보가 높은 문제를 푸는 것이 바람직하다.
첫소리와 자물쇠 문제가 각각 가장 먼저, 가장 늦게 열리는 문제임을 고려하면 다음과 같은 생각 역시 가능하다. 첫소리와 겹치는 문제는 이미 글자가 열려있기 때문에, 열보가 높아 일반 문제일 확률이 높다. 반면 자물쇠 문제와 겹치는 문제는 항상 글자가 열려있지 않기 때문에, 일반 문제일 확률이 낮으리라 추측할 수 있다.
계산해보니 실제로 첫소리 문제와 겹치는 문제가 자물쇠 문제가 아닐 때는 90.5% 확률로 일반 문제인 반면, 자물쇠 문제와 겹치는 문제가 첫소리 문제가 아닐 때는 일반 문제가 아닐 확률이 78.6%이나 된다. 특히 자물쇠 문제의 효과는 단순히 열보=0으로는 설명되지 않는, 자물쇠 문제만의 효과다 (열보=0일 때 일반 문제일 확률은 40%를 웃돈다).
이런 정보를 이용하면, 풀고 싶은 문제의 유형을 고를 확률을 높일 수 있다. 하지만 이 숫자들이 100%에 가깝지는 않은 것을 고려할 때, 자신의 예상이 어긋날 수도 있음을 염두에 두어야 할 것이다.
어떤 단어들을 공부해야 최소한으로 공부하면서 [우리말 겨루기]에서 최대한 높은 점수를 얻을 수 있을까? 많은 시간 단어를 보면서 공부해야 하므로, 내가 준비 과정에서 가장 중요하게 생각한 문제다.
분석 방법에는 관심이 없고 정말 무엇을 공부해야 하는지가 궁금한 분들은 [이론] 부분을 건너뛰면 된다.
이론
다음은 2018-2019년에 출제된 (거의) 모든 [우리말 겨루기] 단어를 현대 국어 사용 빈도 조사 2에 등재된 한국어에서의 사용 빈도에 따라 히스토그램을 그린 것이다.
가령, 사용 빈도가 1-5인 단어가 [우리말 겨루기]에 출제될 확률은 0.06 (6%), 사용 빈도가 26-30인 단어가 [우리말 겨루기]에 출제될 확률은 0.01이다. 보다시피 사용 빈도가 낮은 단어의 출제율이 높다. 따라서 이 자료를 보면 사용 빈도가 낮은 단어를 위주로 공부해야 할 것 같다.
하지만 결론은, 그렇지 않다. 이는 빈도 정보가 있는 모든 단어의 분포 역시 살펴봤을 때 명확해진다.
단순 출제 확률에 따라서 빈도수 1-5인 단어를 공부하기로 한다면, 모든 단어의 13%가량을 공부하면서 [우리말 겨루기]에 출제되는 단어의 6%밖에 맞히지 못한다. 아주 쉽게 생각해서 모든 단어가 1000개, [우리말 겨루기]에 출제되는 단어가 100개라고 하자. 그러면 공부한 단어당 맞히는 문제가 (100*0.06)/(1000*0.13) = 6/130 ~= 1/20이다. 다시 말해 20개의 단어를 공부할 때마다 하나의 [우리말 겨루기] 문제를 맞힐 수 있는 것이다.
반대로 실제 출제 빈도가 41-45인 단어들을 공부한다면, 모든 단어의 0.2%를 공부하면서 [우리말 겨루기] 문제의 0.8%를 맞힐 수 있다. 이전과 같은 단어 숫자를 가정한다면, 공부한 단어당 맞히는 문제가 (100*0.008)/(1000*0.002)=0.4=2/5이다. 5개의 단어를 공부할 때마다 2개, 20개의 단어를 공부하면 무려 8개의 [우리말 겨루기] 문제를 맞힐 수 있는 것이다! 빈도수가 1-5인 단어를 공부했을 때와 효율 차이가 8배나 나는 것이다.
이처럼 단순히 ‘어떤 단어가 많이 출제되냐’를 넘어서, ‘단어 전체 집합에서의 숫자 대비 어떤 단어가 많이 출제되냐‘ 를 따져야 효율적으로 공부할 수 있다.
한편, 위 예시는 이런 전략의 한계 역시 드러낸다. 단순히 효율이 높다고 빈도 41-45인 단어만 공부한다면, 모든 공부를 마쳤을 때 전체 [우리말 겨루기] 문제의 0.8%만 맞힐 수 있다. 반면 효율은 낮지만 빈도 1-5인 단어를 모두 공부하면, 전체 [우리말 겨루기] 문제의 6%나 맞힐 수 있다. 그래서 공부의 효율을 따지는 것이 중요하지만, 내가 공부한 양이 우승하기에 충분한 정도인지도 살펴보아야 한다.
특정 집합의 단어에 대한 ‘효율’과 ‘모두 공부했을 때의 점수’를 측정하기 위해, 단위 ppwg (point per (word*game))과 ppg (point per game)를 정의한다. (“per game” 부분은 굳이 필요하지는 않지만, 사람의 직관이 하나의 회차 내 점수에 맞춰져 있으니 이해를 높이기 위해 더한다.) [우리말 겨루기]에 출제된 일반 문제 단어의 집합을 , 자물쇠 문제 단어의 집합을 , 모든 단어의 집합을 , 데이터에 있는 회차 수를 으로 두자. 특정 단어 집합 에 대하여 다음과 같이 정의한다.
실제로 계산하는 예로, 가장 넓은 범위의 집합을 살펴보자. 표준국어대사전에 수록된 단일 항목 단어는 360,162개, 속담/관용구는 11,338개, 그래서 총공부량은 371,500개이다. 내가 분석했던 2018-2019 데이터는 72개 회차에 걸쳐 일반 문제 (음절조합 등의 유형은 제외한다) 와 자물쇠 문제가 각각 1184개와 360개가 있었다. 그렇다면 표준국어대사전을 모두 공부했을 때의 공부 효율과 공부 후 점수는 각각,
이 수치를 이해하는 방법은 다음과 같다. 공부 효율의 측면에서는 표준국어대사전을 통째로 공부했을 때 단어 하나를 공부할 때마다 [우리말 겨루기]에 출연해 얻을 점수의 기댓값이 0.0071점 오른다 (혹은, 13,600단어를 공부할 때마다 100점이 오른다). 공부 후 점수의 측면에서는, 표준국어대사전을 모두 공부하면 일반 문제와 자물쇠 문제만으로 얻을 점수의 기댓값이 2629점인 것이다.
이상적으로는 공부 효율과 공부 후 점수가 모두 높은 단어 집합을 공부해야겠지만, 그런 집합은 흔치 않다. 따라서 공부 효율이 높은 단어 집합부터 시작해서, “내가 공부한 모든 단어 집합”의 공부 후 점수가 목표 점수를 넘길 때까지 공부하는 것이 올바른 공부 전략이다.
실제
(이론 장을 읽지 않았다면, ppwg은 특정 집합에 속하는 단어를 공부했을 때의 효율, ppg은 특정 집합을 모두 공부했을 때 얻는 점수에 대한 단위이다.)
각 단어 집합이 어떤 효율을 갖는지 표로 정리하였다.
보다시피 기출문제가 효율이 높은 동시에 공부 후 얻는 점수가 상당하기 때문에, [우리말 겨루기] 준비의 핵심은 기출 문제이다. 하지만 기출 문제 만으로는 1등을 노릴 수 없다. 최종 점수와 등수의 관계에 대한 분석을 보면, 정확히 기출 문제만으로 ~1000점을 얻으면 2등을 할 확률이 100%다. 따라서 효율이 높은 단어 집합부터 차례대로 사자성어, 비유적인 표현, 흔한 단어 등등을 공부해야 1등을 할 확률을 효율적으로 높일 수 있다.
2020년 6월 8일 방영. 28세 한유라 참가자가 우승했다. 속도를 제외한 모든 방면에서 뛰어난 성적을 보여주었다. 최근 여러 회차에서 이전 회차 참가자가 등장했지만, 이번 회차 참가자들은 최근 5년 이내에 참가한 이력을 찾을 수 없었다.
한유라 참가자는 813회의 김한순 참가자와 비슷하게 초성 문제 이후에 한 번도 선두를 놓친 적이 없었다. 특히 9번 문제부터 16번 문제까지 모두 한유라 참가자가 맞히는 등 놀라운 성과를 거두었다. 한유라 참가자가 후반에서 쉬는 동안 다른 참가자들이 점수를 따라잡으려고 애썼지만, 결국 뒤집지 못했다.
한유라 참가자는 9번 문제 이후 꾸준히 1등의 상위 10% 점수 범위와 유지하며 뛰어난 실력을 여실히 드러냈다. 권세경 참가자는 일반적인 2등의 점수를 유지했다.
이한휘 참가자는 나이에 대한 정보가 없어 남성 참가자 전체의 점수와 비교했다. 한유라 참가자는 20대 여성 가운데 최근 5년간 최고로 높은 최종 점수를 획득하며 선방했다. 나머지 참가자는 일반적인 점수를 얻는데 그쳤다.
이번 회차는 모든 참가자가 비경쟁 문제 정답률이 높았다는 점에서 특이했다. 그러나 경쟁 문제까지 합쳐서 본 정답률은 한유라 씨만이 높았고 다른 참가자들은 평균과 비슷하거나 하회했다. 한유라 씨가 경쟁적 문제의 60%를 가져갔으니, 지려야 질 수 없는 상황이었다.
권세경 씨와 비교하면, 한유라 씨가 속도를 제외한 모든 면에서 앞섰다. 특히 중요한 정답률과 경쟁 문제 정답 비율에서 크게 뒤쳐졌으므로, 후반의 850 점수 차이가 자연스럽다.