안녕하세요, 로또 당첨의 순간을 함께하는 한국복권데이터 분석실입니다. 오늘은 한국복권데이터 분석실이 분석한 3집단 패턴과 3구간 패턴, 10단위 패턴을 이용해 로또 번호를 분석해보도록 하겠습니다. 먼저 3집단 패턴이란 무엇일까요?

3집단 패턴이란, 소수와 3배수, 합성수로 각각 나누어 번호를 분류하는 방법입니다.

  • 1집단(소수) : 2, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43 (총 13개)
  • 2집단(3배수) : 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45 (총 15개)
  • 3집단(합성수) : 1, 4, 8, 10, 14, 16, 20, 22, 25, 26, 28, 32, 34, 35, 38, 40, 44 (총 17개)

지금까지 총 26개의 패턴이 나왔고 통계적으로 각각 2개씩 나올 가능성이 높으며 이외에도 4배수, 5배수로 분석하기도 합니다. 현재까지 누적된 당첨번호의 3집단 패턴 통계지표는 아래 표처럼 나타납니다.

각각의 분석기법마다 지금까지 누적된 당첨번호를 분석한 그래프를 보면서 자주 나오는 패턴을 파악해보겠습니다. 먼저 3집단 패턴은 지금까지 26가지 수가 나왔으며 그 중 약 20%인 5개 패턴의 합은 전체 당첨번호의 절반이 넘는 54.3%를 차지합니다. 또한 3구간 패턴은 지금까지 27가지 수가 나왔으며 그 중 약 20%인 5개 패턴의 합은 전체 당첨번호의 절반이 넘는 50.7%를 차지합니다.

10단위 패턴은 가지 수가 가장 많은데, 지금까지 154가지 수가 나왔으며 그 중 약 20%인 30개 패턴의 합은 전체 당첨번호의 절반이 넘는 52.8%를 차지합니다. 10단위 패턴의 상위 20%에 해당하는 패턴을 클로즈업 해보면 하단의 표와 같이 나타납니다. 표를 통한 분석 결과, 1-2-1-1-1 패턴이 전체 중 3.3%로 가장 많이 출현했습니다.

그러나 당첨번호의 경향성은 항상 똑같을거라 단정지을 수 없으므로 최근 회차에 대한 분석도 반드시 필요합니다. 약 일 년치에 해당하는 최근 50회차분의 당첨번호의 패턴을 분석하여 전체 누적 당첨번호의 패턴과 비교해 보았습니다. 먼저 3집단 패턴 분포입니다. 대체로 비슷한 듯 보이지만 자세히 보면 각 집단의 출현 비율이 확실히 다르다는 것을 알 수 있으며 특히 3집단의 분포 변화가 두드러집니다.

다음은 3구간 패턴 분포입니다. 마찬가지로 대체로 비슷한 패턴이 나타나지만 각 구간마다 출현 순위가 2-3개씩 뒤바뀌어 있음을 확인할 수 있습니다.

마지막으로 10단위 패턴입니다. 10단위 패턴은 패턴 수가 워낙 다양하기 때문에 최대한 차이를 직관적으로 비교할 수 있도록 박스플롯을 활용해 분석해 보았습니다. 대체로 전체 누적 당첨번호에 비해 최근 50회차에는 단번대~40번대가 고루 분포함을 알 수 있고, 특히 단번대와 40번대의 출현 비율은 예전에 비해 낮아졌음을 확인할 수 있습니다.

경제 분야에는 상위 20%가 전체 생산의 80%를 해낸다는 파레토의 법칙이 있습니다. 파레토의 법칙과 비슷하게 로또에서도 세 가지 패턴 분석에서 공통적으로 상위 20%는 역대 당첨번호의 과반수를 책임져왔음이 이번 분석을 통해 확인되었습니다. 한국복권데이터 인공지능 V9 엔진에서는 이러한 통계적 확률과 머신러닝 기법을 도입해서 로또 번호를 제공하고 있습니다.