설문조사를 원한다면 이는 최대허용오차를 얼마로 할것인지 부터 결정을 해야합니다.
만약 조사결과 그 값이 오차한계 0.05로 하고 싶다면..(이말은 표본으로부터 계산된 어떤 후보의 지지율이 0.43 이 나왔다면 전체 유권자들중 0.38~0.48 정도가 그 후보를 지지할 것이라는 의미)
이렇게 정한 허용오차를 d 로 두고,
실제로 구하고자 하는 표본의 수를 n, 모집단의 수를 N 으로 두면,
그리고 만약 신뢰수준 95%에서 검정을 하고자 한다면 z=1.96
90%에서 검정하고자 한다면 z=1.645.. 99%에서 검정하고자 한다면 z=2.57 도 둡니다.
n=[z^2 *(0.5*0.5)/d^2]/[1+((z^2*0.5*0.5)/d^2-1)/N]
만약 95% 신뢰수준에서 오차한계=0.05, 그리고 N=8560 이라면
n=(1.96^2*0.25/0.05^2)/[1+((1.96^2*0.25/0.05^2) -1)/8560]=367.7
따라서 368명을 조사하면 됩니다.
그리고 군별로 표본의 할당 수는 i번째 군의 수를 Ni 라고 한다면
ni=(Ni/N)*n 으로 구하면 됩니다.(단, 특정한 군의 표본수가 너무 작을 때(30미만...)는 그집단에 대해서는 표본을 더 할당하는 것이 좋을겁니다.
왜냐면... 전체에 대한 분석을 하고난 뒤 집단간 비교가 필요할 경우 표본의 수가 너무 작으면 표본의 '대표성'에 문제가 생기기 때문입니다.
여기에 대한 자세한 내용은 '표본추출법'에 관한 책을 참고하시기 바랍니다.
출처 : 영지문화사 '현대통계학' 15장 내용을 참조해서 작성했습니다.





댓글을 달아 주세요