-
반응형
● 견본 추출
표본에서 해당 모집단으로 일반화하기 위해 많은 연구가 수행됩니다. 결과적으로 표본이 모집단을 대표하는 것이 중요합니다. 이를 합리적으로 확신하기 위해 연구자는 샘플을 선택하는 방법을 신중하게 고려해야 합니다. 때때로 쉬운 방법을 택하고 우연한 방법으로 데이터를 수집하고 싶은 유혹이 있습니다. 그러나 편의만을 기준으로 표본을 선택하면 결과 데이터를 자신 있게 해석할 수 없게 됩니다. 예를 들어 통계 수업의 학생들을 대학 학생의 샘플로 사용하는 것이 쉬울 수 있습니다. 그러나 모든 전공이 커리큘럼에 통계 과정을 포함하는 것은 아니며 대부분의 학생들은 2학년 또는 3학년 때 통계를 듣습니다. 어려움은 이러한 요소(및 우리가 알지 못하는 다른 요소)가 그러한 샘플의 정보를 기반으로 한 추론에 영향을 미치는지 또는 어떻게 영향을 미치는지 명확하지 않다는 것입니다.
샘플을 보는 것만으로는 샘플이 추출된 모집단을 대표하는지 여부를 알 수 있는 방법이 없습니다. 우리의 유일한 보증은 샘플을 선택하는 데 사용된 방법에서 나옵니다.
전체 모집단(인구조사)에서 정보를 얻는 것보다 표본을 선택하는 데는 여러 가지 이유가 있습니다. 때로 관심 대상의 특성을 측정하는 과정은 손전등 배터리의 수명이나 오렌지의 당도를 측정하는 것과 같이 파괴적이며 전체 모집단을 연구하는 것은 어리석은 일입니다. 그러나 샘플을 선택하는 가장 일반적인 이유는 리소스가 제한되어 있기 때문입니다. 사용 가능한 시간이나 돈에 대한 제한은 일반적으로 전체 모집단을 관찰하는 것을 금지합니다.
● 샘플링의 편향
표본 추출의 편향은 표본이 체계적으로 해당 모집단과 다른 경향입니다. 편향은 샘플이 선택된 방식 또는 샘플이 선택된 후 정보를 얻는 방식에서 발생할 수 있습니다. 샘플링 상황에서 접하는 가장 일반적인 유형의 편향은 선택 편향, 측정 또는 응답 편향, 무응답 편향입니다.
선택 편향(언더커버리지라고도 함)은 샘플을 선택하는 방식이 관심 모집단의 일부를 체계적으로 제외할 때 도입됩니다. 예를 들어, 연구자는 연구 결과를 특정 도시의 모든 거주자로 구성된 인구로 일반화하고자 할 수 있지만, 개인을 선택하는 방법은 노숙자나 전화가 없는 사람들을 제외할 수 있습니다. 표본 추출 과정에서 제외된 사람들이 포함된 사람들과 체계적으로 다른 경우 표본은 사실상 모집단을 대표하지 않는 것으로 보장됩니다.포함된 것과 제외된 것 사이의 이러한 차이가 연구에 중요한 변수에서 발생하는 경우 표본 데이터를 기반으로 한 결론은 관심 모집단에 대해 유효하지 않을 수 있습니다. 선택 편향은 자원봉사자나 스스로 선택한 개인만 연구에 사용하는 경우에도 발생합니다. 왜냐하면 스스로 선택한 개인(예: 전화 설문 조사에 참여하기로 선택한 사람)은 참여하지 않기로 선택한 사람과 다를 수 있기 때문입니다.
측정 또는 응답 편향은 관찰 방법이 참 값과 체계적으로 다른 값을 생성하는 경향이 있을 때 발생합니다.
부적절하게 보정된 저울이 항목의 무게를 측정하는 데 사용되거나 설문 조사의 질문이 응답에 영향을 미치는 경향이 있는 방식으로 표현된 경우 이런 일이 발생할 수 있습니다. 예를 들어, American Paper Institute에서 후원한 Gallup 조사(Wall Street Journal, 1994년 5월 17일자)에는 다음과 같은 질문이 포함되어 있습니다. 이와는 대조적으로 음료수 용기, 3류 우편물 및 마당 쓰레기는 매립 쓰레기의 약 21%를 차지하는 것으로 추정됩니다. 이런 점을 감안할 때 일회용 기저귀에 세금을 부과하거나 금지하는 것이 공정하다고 생각하십니까?” 이 질문의 문구가 사람들로 하여금 특정한 방식으로 응답하게 만들었을 가능성이 있습니다.
응답 편향에 기여할 수 있는 다른 요인으로는 질문을 하는 사람의 외모나 행동, 연구를 수행하는 그룹이나 조직, 불법적인 행동이나 인기 없는 믿음에 대해 질문을 받았을 때 사람들이 완전히 정직하지 않은 경향이 있습니다.
측정 편향과 응답 편향이라는 용어는 종종 같은 의미로 사용되지만 측정 편향이라는 용어는 일반적으로 결함이 있는 측정 장비(부적절하게 교정된 척도와 같이)의 결과로 참값에서 체계적인 편차를 설명하는 데 사용됩니다.
설문조사나 여론조사의 무응답률은 데이터 수집 방법에 따라 크게 다릅니다. 설문 조사는 일반적으로 우편, 전화 및 개인 인터뷰를 통해 수행됩니다. 우편 설문조사는 저렴하지만 무응답률이 높은 경우가 많습니다. 전화 설문조사도 저렴하고 신속하게 시행할 수 있습니다.그러나 그들은 짧은 설문 조사에서만 잘 작동하며 무응답률이 높을 수도 있습니다개인 인터뷰는 일반적으로 비용이 많이 들지만 응답률이 더 좋은 경향이 있습니다.
● 선택 편향
모집단의 일부를 체계적으로 배제한 결과 표본이 해당 모집단과 다른 경향.
● 측정 또는 응답 편향
관찰 방법이 실제 값과 다른 값을 생성하는 경향이 있기 때문에 표본이 해당 모집단과 다른 경향이 있습니다.
● 무응답 편향
표본에 포함시키기 위해 선택된 모든 개인으로부터 데이터를 얻지 못하기 때문에 표본이 해당 모집단과 다른 경향.
표본을 선택하는 방식이나 표본에서 데이터를 수집하는 방식에 따라 편향이 도입된다는 점에 유의하는 것이 중요합니다. 표본의 크기를 늘리는 것은 다른 이유로 바람직할 수 있지만 표본 선택 방법에 결함이 있거나 무응답률이 여전히 높은 경우 편향을 줄이는 데 아무런 도움이 되지 않습니다. 편향의 유형에 대한 좋은 논의는 책 뒷부분의 참고 문헌에 나열된 Lohr의 샘플링 책에 나와 있습니다.
● 무작위 샘플링
이 책에서 소개하는 대부분의 추론 방법은 무작위 선택이라는 아이디어에 기반을 두고 있습니다. 가장 간단한 샘플링 방법은 단순 무작위 샘플링이라고 합니다. 단순 임의 표본은 원하는 크기의 서로 다른 가능한 표본이 선택될 확률이 동일하도록 보장하는 방법을 사용하여 선택된 표본입니다. 예를 들어, 대규모 디자인 회사에서 근무하는 모든 직원 중에서 10명의 직원을 단순 임의 표본으로 추출하려고 한다고 가정합니다. 표본이 단순한 무작위 표본이 되려면 10명의 직원으로 구성된 다양한 하위 집합 각각이 선택될 가능성이 동일해야 합니다. 정규직 직원만을 대상으로 한 표본은 모든 직원을 대상으로 한 단순한 무작위 표본이 아닙니다. 시간제로 일하는 사람은 뽑힐 가능성이 없기 때문입니다. 단순한 무작위 표본에 정규직 직원만 포함될 수 있지만 가능한 각 표본, 즉 모든 직원이 표본에 포함될 확률이 동일하도록 선택해야 합니다. 샘플이 단순 무작위 샘플인지 여부를 결정하는 것은 최종 샘플이 아닌 선택 프로세스입니다.문자 n은 샘플 크기를 나타내는 데 사용됩니다. 샘플에 있는 개인 또는 개체의 수입니다. 이전 단락의 설계 회사 시나리오의 경우 n = 10입니다.
크기 n의 단순 무작위 표본은 원하는 크기의 가능한 모든 다른 표본이 선택될 동일한 기회를 갖도록 보장하는 방식으로 모집단에서 선택되는 표본입니다.
단순 무작위 표본의 정의는 모집단의 모든 개별 구성원이 선택될 동일한 기회를 갖는다는 것을 의미합니다. 그러나 모든 개인이 동등한 선택 기회를 갖는다는 사실만으로는 표본이 단순 무작위 표본임을 보장할 수 없습니다. 예를 들어, 한 학급이 100명의 학생으로 구성되어 있고 그 중 60명이 여학생이라고 가정합니다. 연구자는 쪽지에 60명의 이름을 모두 쓰고 쪽지를 섞은 다음 6명을 선택하여 여학생 중 6명을 선택하기로 결정합니다. 그런 다음 유사한 절차를 사용하여 학급에서 남학생 4명을 선택합니다.
학급의 모든 학생이 표본에 포함될 확률은 동일하지만(여학생 60명 중 6명, 남학생 40명 중 4명 선택) 결과 표본은 10명 중 가능한 모든 표본이 다르기 때문에 단순 무작위 표본이 아닙니다. 수업의 학생들은 동일한 선택 기회를 갖습니다.
예를 들어, 7명의 여성과 3명의 남성 샘플 또는 모든 여성의 샘플과 같이 10명의 학생으로 구성된 많은 가능한 샘플은 선택될 가능성이 없습니다. 여기에 설명된 샘플 선택 방법이 반드시 나쁜 선택은 아니지만(사실 이것은 층화 샘플링의 한 예이며 곧 자세히 논의될 것입니다) 단순한 무작위 샘플을 생성하지는 않습니다. 이러한 샘플링 방법으로 얻은 데이터를 분석하기 위한 방법을 선택할 때 이를 고려해야 합니다.
반응형'통계학' 카테고리의 다른 글
간단한 비교 실험 (0) 2023.04.01 견본 추출_2 (0) 2023.03.31 통계 연구: 관찰 및 실험 (0) 2023.03.30 데이터 유형 및 일부 간단한 그래픽 표시 (0) 2023.03.30 통계 및 데이터 분석 프로세스 (0) 2023.03.29