본문 바로가기
학문/심리학개론

윌 로저스 현상(Will Rogers Phenomenon)에 대해 알아보자

by 쉽게 가르쳐주는 2023. 9. 7.

*윌 로저스 현상(Will Rogers Phenomenon)의 개념

통계학과 의학에서 발견된 흥미로운 현상 중 하나로, 데이터 포인트의 이동이 미세하게 조정될 때 평균값을 향상시키는 현상을 설명하는데 사용되는 개념입니다. 이 현상은 1930년대에 윌 로저스라는 미국의 연예인과 인구통계학자가 제시한 것으로 유명합니다. 윌 로저스 현상은 통계학에서 데이터 분석과 해석에 관한 중요한 개념 중 하나로, 특히 의학 연구와 관련된 의사결정에서 자주 사용됩니다.

 

*윌 로저스 현상 예시

이 현상의 핵심 아이디어는 데이터 집합에 새로운 데이터 포인트를 추가하거나 제거하면 평균값이 어떻게 변하는지에 관한 것입니다. 이를 이해하기 위해서는 통계학적 개념과 예제를 통해 살펴볼 필요가 있습니다.

가장 간단한 예를 통해 윌 로저스 현상을 이해해보겠습니다. 예를 들어, 한 학급의 평균 점수가 70점이라고 가정해봅시다. 그리고 다른 학급의 평균 점수가 75점이라고 합시다. 이 두 학급을 합쳐서 하나의 큰 학급으로 만들었을 때, 평균 점수가 어떻게 변할까요?

만약 70점을 받던 학생들 중에서 가장 낮은 점수를 75점으로 올리면, 평균 점수가 상승할 것입니다. 이제 두 학급의 평균 점수는 72.5점이 됩니다. 이처럼 데이터 집합에 새로운 데이터 포인트를 추가하면 평균값이 향상됩니다.

 

*윌 로저스 현상의 핵심 원리

이 현상의 핵심 원리는 다음과 같이 설명할 수 있습니다.

 

1.초기 상황: 두 개의 그룹 또는 집단이 존재하며, 각각의 평균값이 다릅니다.

2.조정: 두 그룹 중 하나의 그룹에서 일부 데이터 포인트를 상위로 조정합니다. 이렇게 하면 해당 그룹의 평균값이 상승합니다.

3.결과: 두 그룹을 합쳤을 때, 전체 평균값 역시 상승합니다.

 

이런 원리로 윌 로저스 현상은 데이터 포인트를 이동시킴으로써 전체 집단의 평균을 개선하거나 높일 수 있습니다.

 

*의학 및 의료 연구에서의 윌 로저스 현상

윌 로저스 현상은 특히 의학 및 의료 연구에서 자주 발견됩니다. 이 현상은 새로운 치료법이나 검사 방법이 도입될 때 나타날 수 있습니다. 

예를 들어, 특정 약물의 효과를 평가하고자 할 때, 환자 그룹을 선정하여 해당 약물을 투여하고 그 결과를 분석합니다.

만약 특정 환자 그룹에서 약물 투여 전 평균 질병 증상이 높은 경우, 이 그룹에서 일부 환자의 증상이 개선된다면, 그 그룹의 평균 질병 증상은 낮아지게 됩니다. 따라서 이 그룹을 다시 전체 환자 그룹에 추가하면, 전체 평균 질병 증상도 낮아지게 되는 것이죠. 이렇게 데이터를 재분석하면 약물의 효과가 높아진 것처럼 보일 수 있습니다.

 

이러한 결과는 의학 연구에서 약물 효과나 치료법의 효과를 과대평가할 수 있다는 점에서 주의가 필요합니다. 따라서 윌 로저스 현상을 고려하여 연구 결과를 분석하고 해석하는 것이 중요합니다.

 

*윌 로저스 현상의 통계학적 설명

통계학적으로 윌 로저스 현상은 데이터 분포의 이동이 평균값을 올리는 방향으로 이루어질 때 나타납니다. 이는 아래와 같은 수식으로 표현될 수 있습니다.

 

두 집단의 평균을 각각 μ1, μ2라고 하고, 두 집단의 크기를 각각 n1, n2라고 할 때, 두 집단을 합친 전체 평균 μ는 다음과 같이 계산됩니다.

 

μ = (n1 * μ1 + n2 * μ2) / (n1 + n2)

 

여기서 n1 * μ1는 첫 번째 집단의 합을 나타내고, n2 * μ2는 두 번째 집단의 합을 나타냅니다. 새로운 데이터 포인트를 추가하여 n1 또는 n2를 증가시키면, 해당 집단의 합도 증가하게 됩니다. 따라서 μ는 새로운 데이터 포인트를 추가함으로써 증가합니다.

 

*실제 의학 연구에서의 예시

의학 연구에서 윌 로저스 현상의 실제 예시를 살펴보겠습니다.

가정: 어떤 새로운 약물 A의 효과를 연구하려고 합니다. 연구를 위해 환자들을 두 그룹으로 나눕니다.

 

그룹 1: 약물 A를 투여하지 않은 환자들

그룹 2: 약물 A를 투여한 환자들

처음에는 그룹 1과 그룹 2의 평균 질병 증상이 각각 60점과 70점이었습니다. 그런데 약물 A를 투여한 그룹 2에서 몇 명의 환자의 증상이 개선되어 그룹 2의 평균 점수가 70점에서 65점으로 내려갔습니다.

 

그런 다음, 윌 로저스 현상을 고려하여 전체 환자 그룹의 평균 점수를 계산합니다. 그 결과, 전체 그룹의 평균 질병 증상 점수는 다음과 같이 계산됩니다.

 

전체 그룹의 평균 질병 증상 점수 = (그룹 1의 점수 * 그룹 1의 크기 + 그룹 2의 점수 * 그룹 2의 크기) / (그룹 1의 크기 + 그룹 2의 크기)

 

= (60 * 100 + 65 * 200) / (100 + 200)

 

= (6000 + 13000) / 300

 

= 19000 / 300

 

= 63.33

 

따라서 전체 그룹의 평균 질병 증상 점수는 약물 A를 투여한 그룹 2에서 개선된 결과로, 초기 평균인 65점보다 더 낮은 63.33점으로 나타납니다. 이로 인해 연구 결과에서는 약물 A가 질병 증상을 개선시키는 것으로 나타날 수 있습니다.

 

*해석 및 주의사항

윌 로저스 현상은 통계학적으로 유용한 개념이지만, 이를 과장하여 사용하면 잘못된 결론에 이르게 될 수 있습니다. 연구자는 데이터를 조작하거나 분석 방법을 조절할 때 윌 로저스 현상을 고려해야 합니다.

또한 이 현상은 데이터의 평균값에만 영향을 미칩니다. 따라서 데이터의 분포, 중앙값, 표준편차 등 다른 통계적 특성은 고려되지 않을 수 있습니다. 따라서 연구 결과를 해석할 때에는 평균값 외에도 다른 통계적 지표를 함께 고려해야 합니다.

마지막으로, 윌 로저스 현상은 주로 데이터의 분포가 극단적인 경우에 나타납니다. 데이터가 더 균일하게 분포되어 있는 경우에는 이 현상이 덜 두드러질 수 있습니다. 따라서 연구에서 윌 로저스 현상을 고려할 때에는 데이터의 분포를 주의깊게 검토해야 합니다.

 

윌 로저스 현상은 데이터 분석 및 의학 연구에서 흥미로운 현상 중 하나로, 데이터 포인트의 이동이 평균값을 올릴 수 있는 현상을 설명합니다. 이 현상을 이해하고 고려하여 데이터를 분석하면 연구 결과를 올바르게 해석하는 데 도움이 됩니다. 그러나 윌 로저스 현상을 과도하게 강조하거나 오용하지 않도록 주의해야 합니다.