본문 바로가기
  • 투자는 내가 산 자산을 누군가 더 비싼 가격에 사줘야 이기는 게임이다.
빅데이터분석

[기초통계학] Chapter 1. 통계학이란 무엇인가?

by 현秀 2023. 12. 29.
 

1. 통계학의 정의

관심 또는 연구의 대상이 되는 모집단의 특성을 파악하기 위해, 모집단으로부터 일부의 자료(표본)를 수집하고 수집된 표본을 정리 · 요약 · 분석하여 표본의 특성을 파악한 후, 표본의 특성을 이용하여 모집단의 특성에 대한 원리와 방법을 제공하는 학문


2. 통계학의 기본용어

(1) 변수와 자료

1) 정보

정보란 일상생활에서 접하는 사실과 현상을 의미를 가지는 것으로 변환한 것

▶ 양적정보 : 숫자로 표현할 수 있는 사실이나 현상(ex. 국민총생산, 주가 등)

▶ 질적정보 : 성질 또는 특성을 나타내는 사실과 현상(ex. 성별, 취미, 선호도 등)

 

2) 변수

변수란 숫자로 표현된 정보 중 그 값이 변화하는 것

▶ 양적변수 : 숫자로 표현할 수 있는 변수(ex. 시험성적, 키, 몸무게 등)

▶ 질적변수 : 범주로 나타낼 수 있는 변수, 범주를 숫자화하여 보여줄 수도 있음(ex. 남자는 1, 여자는 0)

 

3) 자료

자료는 관심이 있는 변수의 실제 관측한 값들의 집합(ex. 5년간 당기순이익 증가율, 매출액 증가율, 고용률 등)

(2) 모집단

- 모집단의 정의 : 연구대상이 되는 모든 개체의 집합. 전체 대상의 속성이 모집단이 되기도 함(ex. 대한민국 남성 전체의 수명)

- 모집단의 한계 : 대부분의 모집단은 매우 커서 전체를 조사하는 것이 불가능한 경우가 많음

(3) 표본

- 표본의 정의 : 모집단에서 선택된 일부의 개체

- 모집단의 전수 조사가 힘들기 때문에 표본을 조사하고 이를 통해 모집단의 특성을 추론

- 표본은 모집단의 특성을 대표할 수 있는지가 매우 중요

- 표본 추출 방법은 크게 확률표본추출과 비확률표본추출로 나뉘어짐

1) 확률표본추출

가. 단순무작위 표본추출

- 모집단으로부터 표본을 균등한 확률로 추출하는 것으로 난수표나 엑셀의 함수 등을 이용

장점
· 모집단에 대한 자세한 지식이 불필요
· 분류에 따른 오류의 가능성을 제거할 수 있음
단점
· 항상 대표성을 지닌 표본이 추출되는 것은 아님
· 다른 표본추출절차에 비해 표본오차가 높아지는 경향이 있음

 

나. 체계적 표본추출

- 표본 프레임에 배열된 구성요소들의 목록에서 일정한 간격으로 개체를 추출하는 방법

- 예를 들어 모집단의 구성원이 100,000명이고 표본의 크기가 100명이라고 하면, 표본추출간격은 1000명이 되고 표본 프레임 목록에서 매 1000번째 개체를 선택하여 표본을 구성

장점
· 모집단에 대한 자세한 지식이 불필요
· 분류에 따른 오류의 가능성을 제거할 수 있음
단점
· 항상 대표성을 지닌 표본이 추출되는 것은 아님
· 다른 표본추출절차에 비해 표본오차가 높아지는 경향이 있음

 

다. 층화 표본추출

- 모집단을 서로 겹치지 않는 몇 개의 집단으로 분류한 후, 각 집단에서 배정된 표본을 단순무작위 표본 추출 방법에 따라 추출하는 방법

장점
· 표본의 크기가 크지 않아도 모집단의 대표성이 보장됨
· 단순임의추출 또는 체계적 표본추출보다 불필요한 자료의 분산을 축소할 수 있음
· 전체 모집단에 대한 추정뿐만 아니라 각 층별 추정결과도 얻을 수 있음

 

라. 집락 표본추출

- 모집단의 전체 구성요소들에 대한 목록을 작성하는 것이 불가능하거나 불필요할 때 사용되는 방법

- 모집단을 서로 인접한 기본단위들로 묶어 집락을 구성하여 먼저 집락을 추출하고, 추출된 집락 내의 일부 또는 전체를 조사하는 방법

- 예를 들어, 어떤 한 중학교 학생들을 1학년 층, 2학년 층, 3학년 층으로 구분하고 각각의 층으로부터 단순무작위추출을 하는 것이 층화표본추출이라면, 그 중학교를 1반 군집, 2반 군집... 6반 군집 이런식으로 한 군집내에 1학년부터 3학년이 모두 포함이 되도록 군집을 만드는 것

2) 비확률표본추출

- 확률표본추출이 불가능하거나 시간과 비용이 매우 많이 드는 경우에 사용

- 과학적 조사방법이 아님

- 간편추출법, 판단추출법, 할당추출법, 눈덩이표본추출법 등이 있음

 


 

KICPA ALLDEMY(https://kicpa-alldemy.com/)의 재무빅데이터분석사2급 강의자료를 학습하고 정리한 글임을 미리 알려둡니다.