분산이란 무엇인가요?
응용수학의 적절한 용어인 분산(Variance).
분산은 각 데이터와 평균 사이의 차이를 제곱한 값의 평균 합입니다. 즉,
여기서 x는 표본의 평균을 나타내고 n은 숫자를 나타냅니다. xi는 개별을 나타내고 s^2는 분산을 나타냅니다.
확률 이론과 통계에서 확률 변수의 분산은 분산 정도, 즉 변수가 예상 값과의 거리를 나타냅니다. 분산의 산술 제곱근을 해당 확률 변수의 표준 편차라고 합니다.
통계적 유의성
데이터 분포가 상대적으로 분산된 경우(즉, 데이터가 평균을 중심으로 크게 변동하는 경우) 각 데이터와 평균 간의 차이의 제곱합은 다음과 같습니다. 크고 분산이 더 큽니다. 데이터 분포가 상대적으로 집중되면 각 데이터와 평균 간의 차이의 제곱합이 더 작습니다. 따라서 분산이 클수록 데이터의 변동이 커지고, 분산이 작을수록 데이터의 변동이 작아집니다.
표본의 각 데이터와 표본 평균 간의 차이의 제곱의 평균 합을 표본 분산이라고 하며, 표본 분산의 산술 제곱근을 표본 표준 편차라고 합니다. 표본 분산과 표본 표준 편차는 모두 표본의 변동을 측정하는 양입니다. 표본 분산 또는 표본 표준 편차가 클수록 표본 데이터의 변동이 커집니다.