표본의 분산에서는 n이 아닌 n-1로 나누는 이유 1. 표본의 분산은 모집단의 분산을 Underestimate(과소평가)하여 (표본의 분산 < 모집단의 분산)와 같은 상태가 되기 때문에 이를 보정해주기 위해서 표본분산의 분모를 작게만들어 전체 표본분산을 크게 만들었습니다. 직관적으로 가장 이해하기 쉬운 설명이지만 왜 n-2이나 n-3 등이 아니라 n-1이라는 정확한 수치에 대한 설명이 안된다. 이에 대한 보충으로 아래 두 개의 설명이 필요하다. 2. 두 번째로는 샘플 분산에서는 Degrees of Freedom(자유도)가 n-1이기 때문이다. 3. 표본의 분산의 기대치를 할 경우, 수학적으로 정확하게 모집단의 분산으로 유도가 되기 때문에 n 대신 n-1로 나누어 준다. 이에 대해 자세하게 정리해놓..
정규분포 정규분포 란? 정규분포는 수집된 자료의 분포를 근사하는 데 자주 사용되며, 이것은 중심 극한 정리에 의하여 독립적인 확률변수들의 평균은 정규분포에 가까워지는 성질이 있기 때문입니다. 정규분포는 2개의 매개 변수 평균과 표준편차에 대해 모양이 결정되고, 이때의 분표는 아래와 같이 표기합니다. 특히, 평균이 0이고 표준편차가 1인 정규분포 를 표준 정규 분포(standard normal distribution)이라고 합니다. 정규 분포 밀도 함수에서 를 통해 X를 Z로 정규화함으로써 평균이 0, 표준편차 1 인 표준 정규분포를 얻을 수 있는 것입니다. Z-분포라고 부르며 Z-분포로 하는 검정(test)를 Z-검정이라고 합니다. 정규분포의 성질 정규분포는 좌우 대칭의 종 모양(Bell curve)으로..
F분포 F 분포(F-distribution 또는 Snedecor's F distribution 또는 Fisher–Snedecor distribution)은 통계학에서 사용되는 연속 확률 분포로, F 검정과 분산분석 등에서 주로 사용된다. 또한, 분산의 비교를 통해 얻어진 분포비율이다. 이 비율을 이용하여 각 집단의 모집단분산이 차이가 있는지에 대한 검정과 모집단평균이 차이가 있는지 검정하는 방법으로 사용한다. 즉 F = (군간변동)/(군내변동)이다. 만약 군내변동이 크다면 집단간 평균차이를 확인하는 것이 어렵다. 분산분석에서는 집단간의 분산의 동질성을 가정하고 하기 때문에 만약 분산의 차이가 크다면 그 차이를 유발한 변인을 찾아 제거해야 한다. 그렇지 못하면 분산분석의 신뢰도는 나빠지게 된다. F분포의 ..
표준 편차와 표준 오차에 대해서 알아보겠습니다. 제가 이 둘을 헷갈려해서 따로 정리하여보았어요~ 그런데 저 뿐만아니라 많은 분들도 헷갈려 하시더라구요. 표준편차 (SD, Standard Deviation) - 점수집합 내에서 점수들 간의 상이한 정도를 나타내는 산포도 측정 도구 - 표준편차가 클수록 평균값에서 이탈한 것 - 표준편차가 작을수록 평균값에 근접한 것 - 변수값이 평균값에서 어느 정도 떨어져 있는지를 알 수 있음 모표준편차 표본표준편차 왜 분모가 n-1인지는 다른 글에 써놓았습니다. 표준오차 (SE, Standard Error) - 표본추출의 과정에서 발생하는 오차와 연관된 것으로 추정량의 정도를 나타내는 측정 도구 - 표본이 모집단으로부터 얼마나 떨어져 있는지를 나타내는 것(모집단이라는거에 ..