가우스는 오차에 대한 고찰을 통해 정규분포를 유도하였는데 그는 오차에도 규칙이 있다고 생각하여 오차는 과학자의 실수로 생기는 값이 아니라 어떤 법칙에 편승해 필연적으로 생기는 것이라 생각하고 다음 세 가지 법칙을 가정한다.
① 매우 작은 크기의 오차는 큰 오차보다 발생할 확률이 높다. ② 같은 크기의 정(+)오차는 부(-) 오차와 발생 확률이 같다. ③ 매우 큰 오차는 거의 발생하지 않는다.
가우스는 이 셋을 가정하고 오차는 실제 관측 값이 주어질 확률이 최대가 되도록 분포하는 것이라 간주하고 최대우도추정법을 이용해 정규분포의 확률 밀도함수를 수학적으로 유도했다.
2. 가우스 오차곡선
가우스함수의 그래프는 좌우대칭의 종 모양의곡선으로 +/-의 극한을 향하면서는 급격히 감소하는 특성을 가진다. 매개변수 a는곡선의 꼭대기 높이가 되며, b는 꼭대기의 중심의 위치가 된다. c는 종의 너비를 결정한다.가우스함수는오차함수의 도함수이다.
가우스 함수는 정규 분포의 확률밀도 함수를 나타낼 때 주로 사용된다. 이 경우 가우스 함수는 다음과 같다.
정규분포는 19세기의 가장 위대한 수학자로 알려진 Carl Friedrich Gauss(1777~1855)에 의해 물리학과 천문학 등에 폭넓게 응용되기도 하였는데, 이러한 연유로 정규분포를 가우스 분포(Gaussian distribution)라고도 불린다.
정규분포 곡선은 다음과 같은 특징을 가지고 있다.
1) 정규분포는 평균을 중심으로 대칭인 종모양(bell-shaped)인 확률밀도 함수의 그래프를 띤다. 2) 정규분포의 모양과 위치는 평균과 표준편차에 의해 완전히 결정된다. 3) 분포의 평균(μ)과 표준편차(σ)가 어떤 값을 갖더라도, 정규곡선과 X축 사이의 전체 면적은 1이다. 4) 정규분포를 가지는 확률변수, 즉 정규확률변수는 평균 주위의 값을 많이 취하며, 평균으로부터 좌우로 표준편차의 3배 이상 떨어진 값은 거의 취하지 않는다. 5) 정규분포곡선은 X축에 맞닿지 않으므로 확률변수 X가 취할 수 있는 값의 범위는 -∞ < X < ∞ 이다.