1. 추정의 개념
1) 점추정 : 한 수치로 추정
2) 구간추정 : 구간으로 추정
ex) 직장인의 평균 근무시간에 대한 추정
점추정 : 8.5시간
구간추정 : 7.8시간부터 9.2시간 사이
2. 점추정
추정량 : 공식
추정값 : 공식에 따라 계산된 수치
표본추출오차의 크기 : E[(θ^ - θ)^2] = E[(θ^ - θ)^2]+Var(θ^)
(θ^ : 추정량, θ:모수)
-> 표본추출오차가 작으려면 위의 값들이 작아야 한다.
- 좋은 추정량의 요건
: 불편성(E(θ^) = θ),효율성(분산이 제일 작은 추정량),일치성
3. 불편성
추정량이 E(θ^) = θ 의 조건을 만족할 때, 이 추정량은 불편성을 만족한다고 한다.
이때, θ^를 모수 θ의 '불편추정량'이라고 부른다.
-> E(X바) = μ, E(S^2) = σ^2,E(P^)=P이므로
추정량 X바, S^2, P^은 각각 모평균, 모분산, 모비율의 불편추정량이다.
불편추정량(대포1) vs 편의추정량(대포2)
-> 표본평균은 불편추정량이나, 중앙값은 편의추정량이다.
4. 효율성
: 불편추정량 중에서 분산이 작은 추정량을 효율적이라고 한다.
-> 셋 중에서 (1)이 효율성을 만족한다고 볼 수 있다.
5. 일치성
즉, n이 무한대만큼 커지면 추정량과 모수의 차이가 임의의 수 E보다 무조건 작아야 한다는 것이다.
-> X바, S^2, P^은 모두 불편성, 효율성, 일치성을 만족하므로 좋은 추정량이다.
6. 모평균 μ에 대한 구간추정
신뢰수준이 1 - α 로 정해지면 추정된 구간 [a, b]는 다음과 같은 특성을 갖는다.
P(a < θ < b) = 1 - α
이 때 추정된 구간 [a, b]를 신뢰구간이라고 한다.
* α : 오차율, 유의수준, 허용오차수준
< 신뢰구간의 일반화 >
점추정값 +- 오차한계
< 신뢰구간에 대한 해석 >
- 편의상 : 신뢰수준의 확률로 모평균이 신뢰구간에 있다.
- 정확한 : 다양한 표본평균에 따라 신뢰구간이 다양하게 나오는데, 이 중 모평균을 포함하는 신뢰구간의 비율이다.
< 모평균 μ에 대한 구간추정 공식 >
1) σ를 알기 때문에 σ를 사용하였고,Z분포를 사용할수있다.
2) σ를 모르기 때문에 S로 대신 사용하였고,
n이 30보다 클 때에는 Z분포를 사용할 수 있지만, 30보다 작으면 t분포만 사용할 수 있다.
7. t분포 구하기
X바 ~ (μ, σ^2/n)이면,
T = X바 - μ / (S / √n)~tn-1
(n-1은 자유도이다.)
t5%를 구하려면,
8. 모평균 μ의 신뢰구간 공식 정리
9. 모비율 p의 구간추정
- 모비율 p에 대한 100(1-α)% 신뢰구간(표본이 충분히 큰 경우)
'AI > Statistics' 카테고리의 다른 글
4. 두 모집단 비교에 대한 추정과 검정 (0) | 2020.12.14 |
---|---|
3. 가설검정 : 모집단이 하나인 경우 (0) | 2020.12.13 |
1. 모수와 통계량의 관계 : 표본 분포 (0) | 2020.12.12 |