• 2023. 3. 30.

    by. 그 시절 우리는

    반응형

    데이터 유형 및 일부 간단한 그래픽 표시

    모든 분야에는 일반적인 단어를 사용하는 고유한 방법이 있으며 통계도 예외는 아닙니다. 이전 수학 및 과학 과정에서 일부 용어를 인식할 수 있지만 통계 언어의 대부분은 생소할 것입니다.

    ● 데이터 설명

    특정 모집단의 개인이나 개체는 일반적으로 연구할 수 있는 많은 특성을 가지고 있습니다. 현재 통계 과정에 등록한 학생 그룹을 고려하십시오. 모집단 학생의 특징 중 하나는 소유하고 있는 계산기 브랜드(Casio, Hewlett-Packard, Sharp, Texas Instruments )입니다. 또 다른 특징은 해당 학기에 구입한 교과서의 수이고, 또 다른 특징은 대학에서 각 학생의 영주권까지의 거리입니다. 변수는 값이 한 개인 또는 개체에서 다른 개체로 변경될 수 있는 모든 특성입니다. 예를 들어 계산기 브랜드는 변수이며 구입한 교과서의 수와 대학까지의 거리도 변수입니다. 데이터는 단일 변수 또는 두 개 이상의 변수를 동시에 관찰한 결과입니다.

    단변량 데이터 세트는 표본 또는 모집단의 개인에 대한 단일 변수에 대한 관찰로 구성됩니다. 단변량 데이터 세트에는 범주형과 수치형의 두 가지 유형이 있습니다. 앞의 예에서 계산기 브랜드는 범주형 변수입니다. "소유하고 있는 계산기 브랜드는 무엇입니까?"라는 질문에 대한 각 학생의 응답 때문입니다. 이 모든 학생들의 응답 모음은 범주형 데이터 세트를 형성합니다. 다른 두 가지 속성인 구입한 교과서의 수와 대학까지의 거리는 둘 다 본질적으로 숫자입니다. 각 학생에 대한 이러한 수치 변수의 값을 결정하면(세거나 측정하여) 수치 데이터 세트가 생성됩니다.

    단일 속성에 대한 관찰로 구성된 데이터 세트는 일변량 데이터 세트입니다. 개별 관찰이 범주형 응답인 경우 단변량 데이터 세트는 범주형(또는 정성적)입니다. 단변량 데이터 세트는 각 관찰이 숫자인 경우 숫자(또는 양적)입니다.

    두 가지 유형의 수치 데이터

    수치 데이터에는 불연속형과 연속형의 두 가지 유형이 있습니다. 변수의 가능한 값이 수직선의 고립된 점에 해당하는 경우 숫자 변수는 불연속 데이터가 됩니다. 가능한 값 세트가 수직선에서 전체 간격을 형성하는 경우 숫자 변수는 연속 데이터가 됩니다.이산 데이터는 일반적으로 각 관찰이 계산에 의해 결정될 때 발생합니다(: 학생이 등록된 수업 수 또는 특정 유형의 꽃에 있는 꽃잎 수).일반적으로 관찰이 계산과 반대로 측정을 포함할 때 데이터는 연속적입니다. 실제로 측정 장비는 무한한 정확도를 갖지 않으므로 엄밀히 말하면 가능한 측정 값은 수직선에서 연속체를 형성하지 않습니다. 그러나 연속체의 모든 숫자는 변수의 값이 될 수 있습니다. 불연속 데이터와 연속 데이터의 구분은 확률 모델에 대한 논의에서 중요합니다.

    ● 범주형 데이터의 빈도 분포 및 막대 차트

    데이터의 적절한 그래픽 또는 표 표시는 정보를 요약하고 전달하는 효과적인 방법이 될 수 있습니다. 데이터 세트가 범주형인 경우 데이터를 표시하는 일반적인 방법은 도수 분포라고 하는 표 형식입니다. 범주형 데이터의 빈도 분포는 관련 빈도 및/또는 상대 빈도와 함께 가능한 범주를 표시하는 표입니다. 특정 범주의 빈도는 해당 범주가 데이터 세트에 나타나는 횟수입니다. 특정 범주에 대한 상대 빈도는 범주를 생성하는 관측치의 비율입니다.

    테이블에 상대 빈도가 포함되어 있으면 상대 빈도 분포라고도 합니다.

    빈도 분포는 데이터 세트를 표 형식으로 표시합니다. 범주형 데이터를 그래픽으로 표시하는 것도 일반적입니다. 막대 차트는 범주 데이터에 대해 가장 널리 사용되는 그래픽 표시 유형 중 하나입니다.

    ● 막대 차트

    막대 차트는 범주형 데이터의 빈도 분포 그래프입니다. 빈도 분포의 각 범주는 막대 또는 사각형으로 표시되며 각 막대의 면적이 해당 빈도 또는 상대 빈도에 비례하도록 그림이 구성됩니다.

    막대 차트 : 범주형 데이터를 사용하는 경우.

    시공방법

    1. 가로선을 긋고 그 아래에 일정한 간격으로 카테고리 이름이나 라벨을 적는다.

    2. 수직선을 그리고 빈도 또는 상대 빈도를 사용하여 척도에 레이블을 지정합니다.

    3. 각 카테고리 라벨 위에 직사각형 막대를 배치합니다. 높이는 범주의 빈도 또는 상대 빈도에 의해 결정되며 모든 막대의 너비는 동일해야 합니다. 너비가 같으면 막대의 높이와 면적이 빈도와 상대 빈도에 비례합니다.

    무엇을 찾아야 하는가

    자주 발생하는 범주와 드물게 발생하는 범주.

    수치 데이터에 대한 점도표.

    점도표는 데이터 세트가 상당히 작을 때 숫자 데이터를 표시하는 간단한 방법입니다. 각 관찰은 수평 측정 척도에서 해당 값에 해당하는 위치 위의 점으로 표시됩니다. 값이 두 번 이상 발생하면 각 발생에 대한 점이 있으며 이러한 점은 수직으로 쌓입니다.

    점도표 :작은 숫자 데이터 세트를 사용하는 경우.

    시공방법

    1. 수평선을 그리고 적절한 측정 눈금으로 표시합니다.

    2. 측정 척도를 따라 데이터 세트에서 각 값을 찾아 점으로 표시합니다. 동일한 값을 가진 관측치가 두 개 이상인 경우 점을 수직으로 쌓습니다.점표는 다음에 대한 정보를 전달합니다.

    데이터 세트의 대표 또는 일반 값.

    데이터 값이 퍼져 있는 정도.

    수직선을 따라 분포된 값의 특성.

    데이터 세트에 비정상적인 값이 존재합니다.

    반응형