[CRUX]수치 데이터를 이용한 표본분석 : 이론
크럭스(CRUX) 컨설팅
크럭스 컨설팅 12월 11일(월) 올해 마지막 정시예약 : 여기 클릭하시면 됩니다.
<수치 데이터를 이용한 표본분석 이론>
안녕하세요. CRUX 김희범입니다.
(글 읽으시기 전에 ‘좋아요’와 ‘팔로우’ 부탁드립니다)
표본분석이란 무엇일까요? 표본분석은 왜 하는 것일까요?
이 질문에 대한 답변은 표본분석을 시도하는 이유와 이용하는 방법에 따라 크게 달라질 수 있습니다.
전통적인 표본분석은 내 위에 있는 모든 사람들을 조사하고 기록하고 관찰하는 것입니다. 지원권이 한정된 폐쇄된 구간에서 흔히 ‘카운팅’이라고 불리는 방법으로 허수, 추합 등 빠져나갈 인원을 한 명씩 걸러냅니다. 경쟁자들의 점수, 타 지원 학과를 하나씩 찾고 별명을 붙이거나 특이사항을 메모할 수도 있습니다. 이러한 추적은 잘못하면 끝이 없는데, 경쟁자들이 지원한 학과의 표본을 열어보지 않으면, 결국 의미가 없기 때문입니다. 따라서 매우 제한적으로만 사용할 수도 있고, 개인이 사용할 수 있는 대상 범위는 넓게 잡아도 이과는 인설의, 문과는 과거 서울대 지원권 정도입니다. 이러한 방법의 목적은 닫힌 구간 내 미시적인 한두 자리 싸움에서 승리하는 것입니다.
그보다 넓은 구간에서도 내 위 경쟁자들의 점수를 하나씩 기록할 수는 있습니다. 하지만 추합을 따지거나 경쟁자의 이동을 찾자니 끝이 없습니다. 요즘 계열제 모집단위나 대형과는 모집인원만도 100명이 넘어가는데, 이들을 모두 기록하고 있을 수는 없는 노릇입니다. 오히려 간소하게 각 ‘표본’이 아니라 ‘수치’를 다루기도 합니다. 나의 등수가 몇 등인지, 예상 컷부터 나까지 몇 명이나 있는지 등입니다. 그런데 이런 데이터는 모아 놓아도 제대로 읽기가 어렵습니다. 각 수치들이 어떤 의미를 내포하고 어떻게 연결되는지 잘 모르기 때문입니다. 그리고 분석서비스들이 제공하는 수치 지표들은 결국 분석서비스가 제공하는 결론으로 귀결됩니다. 그렇다 보면 숫자들에서 유의미한 정보를 뽑아내지 못하고 ‘칸수’에 매몰됩니다.
수치를 다루는 표본분석의 목적은 무엇일까요? 수치를 이용한 표본분석의 목적은 거시적인 측면에서 ‘흐름’을 읽는 것입니다. 한두자리 싸움에 집중하는 것이 아니라, 내가 속한 게임판의 상황을 읽는 용도입니다.
입시에 임하는 개인이 ‘흐름’을 읽는 것은 매우 어렵고 한정적입니다. 아래는 ‘개인’이 조금이나마 흐름을 느낄 수 있도록 하는 의도에서, 최대로 간략화한 데이터 정리 시트 양식입니다. (저희 '컨설턴트'들은 훨씬 더 종합적인 다른 방식을 사용합니다. 기본적으로 제 노하우를 바탕으로 하되, '개인'도 시도해볼 수 있도록 계량했습니다.)
오늘은 바로 이 수치 데이터를 이용한 표본분석에 대해서 소개해 보려 합니다.
엄밀히 말하면 표본분석이라기보다는 나만의 입시 리포트, 혹은 입시 포트폴리오라고 생각할 수 있을 것 같습니다. 필요한 만큼, 가능한 만큼, 할 수 있는 만큼, 하고 싶은 만큼 수치를 모으고 계산하면 됩니다. 오늘은 양식에 대한 설명이고, 다음 글이 보다 실전적일 예정입니다.
먼저 상단은 과거 데이터와 올해 나의 정보를 기입하는 부분입니다.
왼쪽 위에는 관찰하고자 하는 학과 정보(학교, 군, 학과)를 적습니다.
상단 중앙 부분에는 과거 데이터를 입력합니다. 당시의 모집정원과 추가합격인원, 지원자수를 기입하면, 엑셀을 이용하여 자동으로 합격총원, 추합율, 최종경쟁률을 구할 수 있습니다.
이렇게 정보를 기입해 놓으면, 어느 정도 규모의 과인지, 어느 정도 추합이 도는지, 경쟁률은 어느 정도 되는지를 확인할 수 있습니다. 다만 주의할 점은 학과 신설, 통폐합, 군 변동, 입시 정책 변화(교차지원 도입) 등에 따라 데이터가 크게 바뀔 수 있습니다. 올해가 바로 그 변화의 해일 수도 있고요. 이러한 히스토리와 특이사항을 가장 오른쪽 메모란에 기록해 놓으면 됩니다.
과거 누백도 기록합니다. 컨설턴트들은 조금 더 체계적인 방법을 사용하지만, 개인이시라면 많이들 이용하는 누백 데이터를 쓰셔도 무방합니다. 70% 누백은 공시되는 정보를 바탕으로 하는데, 과거 합격인원의 허리하단부 누백을 확인할 수 있게 해주어 안정 지원 범위를 확인시켜줍니다. 100% 누백은 점공 등을 통해 확인하거나 자체적으로 예측한 추정치에 바탕으로 둡니다. 인터넷에 돌아다니는 누백은 틀린 정보가 많지만, 일반적으로 폭빵을 확인할 수는 있습니다. 3~4개년치 데이터에서 툭 튀는 누백값이 보이면 폭이나 빵으로 보시면 됩니다. 이러한 내용도 해석해서 오른쪽 메모란에 적어놓으면 좋습니다.
그리고 과거 누백들 바로 밑에 올해 나의 누백을 기록하시면 됩니다. 과거의 70%컷, 100%컷과 비교해서 매우 대략적으로 자신의 위치를 가늠할 수 있습니다. 사실 각 해의 누백은 서로 독립적인 것이어서 이렇게 묶어보는 것이 엄밀한 방법은 아닙니다. 주의하여 사용하시기 바랍니다. 분석기도 입시철에 계속 최신판이 나오는데, 최신 누백을 기록하고 싶으시다면, 그냥 기존 나의 누백을 지우고 새로운 나의 누백을 기록하면 됩니다. 이전 누백도 남기고 싶으시면, 메모란에 히스토리를 남겨놓으면 됩니다. (사실 누백은 라인 잡는 시기 이후로는 무용한 편이어서 굳이 세세하게 최신화하지 않아도 됩니다. 다만, 분석기를 철썩 같이 믿는 지원자들도 있어서, 하나의 변인으로 인정하고자 기록할 수 있는 공간을 마련한 것입니다.)
왼쪽 아래에는 나의 산출점수를 기록합니다. 변환표준점수 공개 이후 점수가 달라질 수 있는데, 이 경우는 위 누백과 달리, 반드시 새롭게 바뀐 자기 점수를 업데이트하시길 바랍니다.
내 점수 오른쪽에는 올해 모집인원을 기록합니다. 이 부분도 데이터가 최신화될 수 있습니다. 수시 이월 전에는 최초 모집인원이나 예측 모집인원을 사용하다가, 최종모집인원이 공개되면 수치를 바꿔주면 됩니다. 이러한 변동도 메모란에 변동일과 함께 기록해주시면 좋습니다.
모집인원을 기록하면, 과거데이터를 바탕으로 기대 추합인원, 기대 합격인원, 평균추합율, 기대지원자수, 평균경쟁률을 확인할 수 있습니다.
이 수치들을 설명하자면,
평균추합율은 그 위에 기입했던 ‘과거 추합율의 평균치’입니다.
‘기대 추합인원 = 최종모집인원 x 평균추합율’로 과거 정보를 바탕으로 올해 기대되는 추합인원을 구할 수 있습니다.
‘기대 합격총원 = 최종모집인원 + 기대 추합인원‘ 입니다.
평균경쟁률은 그 위에 기입했던 ‘과거 경쟁률의 평균치’입니다.
‘기대 지원자수 = 최종모집인원 x 평균경쟁률’이며, 과거 경쟁률을 바탕으로 올해 기대되는 지원자수를 구할 수 있습니다.
주의할 점은, 튀는 값이나 더 이상 유의미하지 않은 값이 존재할 수 있다는 점입니다. 모집 인원 변화, 군 이동, 학과 통폐합, 입시 제도 및 방식 변화, 폭빵, 마감 직전 절대적으로 낮았던 경쟁률 등등이 원인입니다. 이러한 히스토리를 알고 있느냐, 아웃라이어 등을 어떻게 처리할 것이냐가 ‘개인’의 실력이라고 할 수 있습니다.
다음은 본격적으로 수치들을 기록하는 부분입니다.
왼쪽에는 날짜를 기록합니다. 저는 12/30~1/5으로 7일간 한 번씩으로 예시 시트를 만들어드렸지만, 개인의 상황에 따라 날짜나 시간대를 더하거나 빼거나 하시면 됩니다. 그래도 마지막 3일간은 하루에 한 번씩은 기록하기를 권합니다.
입력해야 하는 정보는 예측 지표, 예측컷, 최초합격 가능 인원, 추가합격 가능 인원, 실제지원한 분석대상자수와 나의 등수, 나보다 하나 높은 칸까지의 인원수 내 칸의 꼴지의 순위, 나의 실제지원 등수 변화, 전체 모의지원자수와 그중 나의 전체 등수, 예측 지원자수, 적정 누백(점수)과 예상 누백(점수)입니다.
하나씩 설명드리면,
예측지표는 각자 자신이 보고 있는 지표를 입력하면 됩니다. 색깔일 수도 있고, 확률일 수도 있고, 0부터 9까지 숫자일 수도 있습니다. 모두가 보기 때문에 기록합니다.
예상점수는 예측컷입니다. 문을 닫을 것으로 예측되는 표본 인원의 점수일 것입니다.
최초합격 가능 인원은 지원 표본에서 최초합격으로 판단되는 인원수를 의미합니다.
추가합격 가능 인원은 지원 표본에서 추가합격으로 판단되는 인원수를 의미합니다. (합격 가능 인원 – 최초합 가능 인원)으로 구할 수도 있고, 편한 방식대로 기록하고 수식을 걸어주면 됩니다.
‘합격가능인원 = 최초합격 가능 인원 + 추가 합격 가능 인원’입니다.
나의 등수와 분석대상자수는 실지원이 예상되는 집계된 모의지원자수와 그 중 나의 순위입니다.
나의 위치는 '나의 등수 / 합격가능인원'을 백분위(%)로 표시하여 나타냅니다. 컷으로부터 나의 상대적인 위치를 가늠할 수 있습니다. 일반적으로 70%를 안정으로 봅니다. 보수적으로는 60%까지 잡을 때도 있습니다. 하지만 때로는 110%도 안정일 수 있습니다. 거시적으로 흐름을 읽는 것이 중요하고, 이 수치의 고평가와 저평가를 읽어내는 것이 실력입니다. 저희 노하우이기도 하고요. '개인'이 제일 어려움을 겪는 분야입니다.
나의 등수 변화는 그 이전에 기록한 ‘나의 등수’와 방금 기록한 '나의 등수'의 차이를 적는 것입니다. 등수가 앞으로 갔을 때 양수로 할 지, 음수로 할 지 등은 편한 방식대로 하시면 됩니다.
컷까지 인원은 나로부터 문 닫을 것으로 예상되는 사람까지 몇 명이 있는지입니다. 합격가능인원에서 나의 등수를 빼서 구합니다. 내 위로 몇 명이 들어오면 자신이 문을 닫게 되는지, 내 앞으로 몇명이 빠져야 내가 문을 닫을 것으로 예측되는지 확인할 수 있습니다.
오른쪽 아래에 윗지표 누적 인원과 내 지표 누적 인원은 표본 상에서 나보다 하나 높은 지표를 받은 꼴지의 순위와 나와 같은 지표를 받은 꼴지의 순위입니다. (본인이 보는 '예측지표'와 같은 지표를 의미합니다) 나의 등수와 비교하여 보면 나의 위치를 조금 더 잘 가늠할 수 있습니다.
전체등수와 전체지원자수는 그 학과를 모의지원한 모든 경쟁자들의 수와 자신의 순위입니다.
예측 지원자수는 예측되는 올해 지원자수입니다.
예측 지원자수를 기입하였다면, 상단에 기록했던 최종모집인원으로 나누어 예측 경쟁률을 구합니다.
적정 누백과 예상 누백은 많이들 보는 누백의 적정 누백(혹은 점수)과 예상 누백(혹은 점수)을 기록하면 됩니다. 적정 대신 소신을 이용하셔도 됩니다. 매번 기록할 정도로 중요도를 갖는 수치는 아닙니다. 굳이 안 보셔도 되고, 앞서 말했듯 누군가는 보기 때문에 같이 확인합니다.
마지막으로,
‘예측 표집비율 = 분석대상자수 / 예측지원자수’,
‘기대 표집비율 = 분석대상자수 / 기대지원자수’로 구합니다.
예측 표집비율과 기대 표집비율은 예측 혹은 기대치 대비 얼마만큼 표본에 경쟁자들이 확인되고 있는지를 확인시켜줍니다. 이 수치가 높다면, 이 학과에 대해 표본의 현실성이 높거나, 실제 표본이 외적·시스템적으로 ‘가정’된 정도를 넘어서고 있거나, 실제지원자들이 많이 들르고 있다는 뜻입니다.
수치들에 대해 설명했으니, 어떻게 보면 좋을지 간략히 다루겠습니다. 설명드렸듯, 수치는 거시적인 흐름이나 가정을 확인하기 위해 관찰하는 것입니다.
1. ‘과거를 바탕으로 기대되는 수치’와 ‘올해 보여지고 있는 수치’를 비교합니다. (통시적)
2. 어떤 정보가 실제 데이터가 아닌 추정에 의해 가정되고 있는지를 살핍니다. (가정)
3. ‘올해 보여지고 있는 수치’의 변화를 관찰합니다. (추이)
4. 하나의 학과가 아닌, 목표 지점의 좌우와 상하의 데이터를 같이 모아서 비교하며 살핍니다. (공시적)
5. 이를 통해, ‘나의 위치’를 ①구조적으로 ②상대적으로 확인하고, 내 경쟁자들이 무엇을 보고 있고, 어떤 판단, 행동, 추이를 보여주고 있는지 / 보일 것인지 잡아냅니다. (가설/시나리오 설정)
필요한 만큼, 가능한 만큼, 할 수 있는 만큼, 하고 싶은 만큼 하시면 됩니다. 부족하다고 생각되면 더 정보를 수집하면 되고, 과하게 느껴지면 덜어내면 됩니다.
커트라인 형성과 폭빵의 원리는 단순하지만, 현실에서 드러나는 양상과 시그널은 꽤나 다변적입니다. 지금까지 말씀드린 방법은 ‘개인’이 여러 상황에서 판을 읽고 능동적으로 판단하기 위해, 최소한으로 확인하면 좋을 ‘수치’들을 모으고 확인하는 방법이었습니다. 열심히 한다고 좋은 결과가 따라오는 것은 아니지만, 열심히 하면 최소한 손해보지는 않는 것이 입시입니다. 저의 이전 글들과 이어질 글을 읽으시면 조금 더 이해가 될 것입니다.
다음 글에서는 위 방법을 통해 실제 사례를 분석해보겠습니다. 감사합니다.
취소분 등의 올해 마지막 정시상담 예약 : 12월 11일 월요일
크럭스상담 우선권을 부여하는 예약신청서 작성 : https://zrr.kr/nERp
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
어떤 이유임? 그래도 맘에 드시니 사셨을건데
-
난 예쁘면 용서되드라
-
서바4회국어 0
혹시 푸신분계신가요? 이거 로터세일지문 4문단에서 풍향설명이 반대지않나요?
-
ㅈㄱㄴ
-
중앙대학교 최고 대외활동! 미디어커뮤니케이션학부 청소년 미디어캠프 ‘시퓨즈’ 개최 안내 0
안녕하세요! 중앙대학교 미디어커뮤니케이션학부 청소년 미디어캠프 '시퓨즈(Shift...
-
이러다 진짜 한국 망한다…2045년부터 전국 시도서 벌어지는 일 ‘충격’ 1
30년간 부산·울산 인구 26%↓ 출생아 오는 2045년부터 전국의 모든 시도에서...
-
출제자의 의도 , 출제자 풀이 등을 포함해서 6월 3일 이후에 올려보겠습니다.....
-
“우리 아빠 로또 사면 ‘꽝’인 이유 알았어요” [수민이가 화났어요] 1
'로또 예측 서비스' 피해 급증 2022년부터 연간 600건 이상 접수 소비자원...
-
음성파일 디씨애들 올린거 들어보니까 개웃기던데
-
3개월전까지만해도 영어 고자였는데 구문만 들입다 팠는데 이제 누구보다도 구문잘가르칠수 있음
-
"아저씨 떨어지세요 다쳐요!"…사람 매달고 내달린 음주車 추격한 시민 1
[이데일리 채나연 기자] 음주운전을 하다 접촉사고를 낸 뒤 사람을 매달고 도주하던...
-
목욕탕 갈건데 배가 좀 고픈데..
-
나의 인생목표 1
존예랑 사귀면서 15일마다 갈아채우기 게임하고 싶을 때마다 게임하기 이것만 가능해도 좋겠다
-
훈련병 ‘완전 군장 얼차려 사망’ 12사단 출신 병·간부들, “듣도 보도 못한 사례” 4
최소 2019년부터 2023년까지 5년간 없던 일 “몰래 흡연, 점호불량 등은...
-
6모전까지 다 푸는건가요?
-
“많이 힘들지?” 軍, 사망 훈련병 지휘 女간부 심리 상담 3
강원에 있는 모 육군 부대에서 한 훈련병이 군기 훈련(얼차려)을 받다 사망한 가운데...
-
해설 쌈@뽕한걸로 마더텅 해설 쉬운방법 놔두고 너무 어렵게 푼다
-
한솥=독재의 꽃 1
가성비 원탑
-
덕코 확률 주작 0
이라고 말해줘 ㅜㅜ 10000덕 썼는데 3등도 안되면 어쩌라는거야
-
옛날 모평에 있던 문제를 참고했습니다. 신유형으로 나올 일은 없을 것 같으므로...
-
급우울해짐
-
라면에 제육덥밥 두메뉴 주문해서 먹는 성인 남성 은근많이봄 ㄹㅇ
-
하기 전에는 굉장히 떨렸지만 하고 나니 꽤 짜릿하네요 ㅎㅎ
-
단어만 처어려운건 외우면 되는데 문장구조자체가 겁나 어렵고 하는거 어뜨케 해야할지를...
-
'의대 공모 반발' 전남 동부권, 지역민 97.5% "순천대 신설 지지" 1
(순천=뉴스1) 김동수 기자 = 전남 동부권 지역민 10명 중 7명은 전남도 주관...
-
진짜 재밌겠다...
-
스카인데 꽉차네
-
지난 28일 밤 북한이 살포한 것으로 추정되는 대남 전단 풍선이 서울 노원구의 한...
-
1주만에 활동 재개 의협회장 "패배주의에 난리 아냐…날 따르라" 1
(서울=뉴스1) 천선휴 기자 = 대한의사협회가 30일 전국적인 촛불집회를 앞두고...
-
과탐형님들의 보이지않는 시선에 중압감이 무서워요
-
집 가고 싶다 4
배고프다 집 가서 피자 먹고 싶다
-
메디고시 딱 대
-
사탐런 고민 4
생지하다가 3모 이후로 사문지구 하고있습니다. 공대가고싶긴한데 주목표는 무조건...
-
n티켓 풀다가 계속 막히는데 기출로 돌아가는게 맞겠져?
-
6시간 -7시간 꾸준히 자는거같은데 학교에서 하루종일 졸고 낮잠 2시간은...
-
서울대생들아 1
나 텝스 준비하려고 하는데 꿀팁점여...
-
가속하는 로케트 안에 관성력은 없다고 보는거죠? 그니깐 안에 있는 사람이 볼 때...
-
구구절절 맞는말.
-
굳이굳이 세게 닫는 이유가 뭘까 진짜 움찔할 정도로 세게 닫아서 쟤만 왔다갔다 하면 집중 다 깨짐
-
25살에 들으면 되게 죻을듯
-
내 자식 부회장 낙선에 앙갚음?…'악성민원' 학부모, 조희연 무고로 고소 1
서울시교육청이 '악성민원' 학부모를 경찰서에 고발하자, 이 학부모도 역으로 조희연...
-
[단독]北, ‘오물 풍선 테러’ 직후 GPS 전파 교란 공격 2
북한이 오물과 쓰레기가 담긴 대형 풍선 수백 개를 한국 전역을 향해 내려보낸 직후인...
-
영어 노베이스 5
영어 살면서 해본적이 없는데 지금부터 워마 암기하면서, 수특으로 듣기연습 하면...
-
애니나 추천해봐 26
정주행 달려야지
-
제곧내
-
[무료구문특강] 분사구문 B.1 패턴 / 문장이 끝났는데 V-ing? 0
안녕하세요! 오르비 여러분들! 이제 곧 수능까지 많은 시간이 남지 않았고... 이번...
-
아 전과하고싶다 5
할거면 불대로 가 왜 법학만해관으로 붙어있으니까 지나다니면서 볼 수 있잖아 싫어...
-
누군가가 등장해서 집값 평균 12억 만들고 출생아수 40만 -> 25만명 만들고...
-
특히 수능은 아무리 수능이 괴랄해지더라도 수능특유의 느낌과 잘맞는 재능을 소유했다면...
-
메가스터디교육, 2000년 창립 이래 총 1600억 장학금 지급 2
메가스터디교육이 회사 설립 이후부터 다양한 장학제도를 통해 지급한 누적 장학금...
좋은글감사합니다
ㄹㅇ 좋은글.
110%는 10%의 오타인가요?
아닙니다. 해당 수치는 확률이 아니라 누적 등수 개념입니다.
40명 합격 가능할 때 44등이면 110%입니다. 구간 자체가 고평가되어 있으면 110%여도 안정~적정 카드일 수 있습니다. 그런곳을 잘 찾는것이 저희의 강점 중 하나입니다.
글 감사합니다
그런데 예측지원수는 마음대로 정하는 건가요?
많이들 보는 곳의 예측치입니다. 보조도구로써 역이용합니다. 이 예측치가 자꾸 틀려서그런지 작년부터 잘 공개하지 않습니다. 쪽지 주시면 보다 자세히 답변드리겠습니다!