본문 바로가기
  • 투자는 내가 산 자산을 누군가 더 비싼 가격에 사줘야 이기는 게임이다.

빅데이터분석5

[기초통계학] Chapter 5. 확률변수와 확률분포 1. 변수와 확률변수 (1) 변수 변수란 숫자로 표현된 정보 중 그 값이 변화하는 것 ▶ 양적변수 : 숫자로 표현할 수 있는 변수(ex. 시험성적, 키, 몸무게 등) ▶ 질적변수 : 범주로 나타낼 수 있는 변수, 범주를 숫자화하여 보여줄 수도 있음(ex. 남자는 1, 여자는 0) (2) 상수 상수란 경우에 따라 변화하지 않고 고정되어 있는 값 (3) 확률변수 - 확률변수의 정의 : 무작위 실험을 하는 경우 특정 확률로 발생하는 각각의 결과를 수치로 표현한 변수 - 예를 들어, 주사위 하나를 던질 때 발생할 수 있는 경우는 1, 2, 3, 4, 5, 6인 6가지인데, 이 6가지 경우를 확률변수라고 하며, 6가지 사건의 집합이 표본공간임 2. 이산형 확률변수와 연속형 확률변수 (1) 이산형 확률변수 - 변수.. 2024. 1. 17.
[기초통계학] Chapter 4. 확률 1. 표본공간과 사건 (1) 표본공간 표본공간이란 실험에 의해 나타날 수 있는 가능한 모든 결과들의 집합 ▶ 이산형 표본공간: 표본공간의 원소개수가 유한개이거나 무한하지만 셀 수 있을 경우(ex. 정상품 or 불량품) ▶ 연속형 표본공간: 표본공간의 원소개수가 무한하면서 셀 수 없을 경우(ex. 배달음식이 배달되는데 걸리는 시간) (2) 사건 사건이란 몇 개의 원소들로 이루어진 표본공간의 부분집합 2. 확률 (1) 확률의 고전적 정의 확률이란 어떤 사건이 일어날 가능성의 척도를 측정하는 숫자로 0과 1사이의 값으로 표시 ▶ 이산형 표본공간에서 확률 정의 : P(A) = 사건 A에 속하는 원소의 수 / 표본공간의 전체 원소의 수 ▶ 연속형 표본공간에서 확률 정의 : P(A) = 사건 A에 속하는 원소에 대.. 2024. 1. 10.
[기초통계학] Chapter 3. 기술통계분석 1. 기술통계학과 추리통계학 (1) 기술통계학 기술통계학이란 자료 수집을 통해 얻은 자료를 이용하여, 어떠한 판단이나 예측과 같은 주관이 섞일 수 있는 과정을 배제한 채 정보를 단순히 요약하고 기술하는 것(ex. 평균, 분산, 비율, 최대값, 최소값, 상관계수 등) (2) 추리(추론)통계학 추리통계학은 기술통계로 얻어진 데이터로부터 유용한 정보를 추출하는 것(ex. 통계적 추정, 가설검정, 예측 등) 2. 기술통계량을 이용한 자료 분석 (1) 집중화경향(중심경향성)의 측정 집중화경향이란 자료가 어디에 집중되어 있는가를 하나의 대표적인 값으로 요약하여 나타낸 통계량 1) 평균(mean) 평균은 자료의 값들을 모두 더하고 이를 자료의 개수로 나눈 값 [파이썬 코드] import numpy as np # nu.. 2024. 1. 1.
[기초통계학] Chapter 2. 자료의 척도와 형태 1. 자료의 척도 척도는 조사 대상을 측정하기 위해 부여한 숫자간의 관계 척도 내용 명목척도 측정대상이 어느 집단에 속하는지 분류하는 경우에 사용되는 척도 - 성별 구분(ex. 남, 여) - 주거 유형 구분(ex. 전세, 월세, 자택) 서열척도 측정대상들을 비교하기 위해 특성의 대소의 서열에 따라 수치를 부여한 척도 - 소득계층(ex. 고소득층, 중간층, 저소득층) - 리커트 척도(ex. 선호도 조사) 등간척도 순위를 부여하고 순위 사이의 간격이 동일하여 양적인 비교가 가능한 척도 - 온도계 수치 - 리커트 척도(ex. 선호도 조사) 비율척도 구간척도가 갖는 특성에 대해 절대적인 원점이 존재하고 두 측정값의 비율이 의미를 지니는 척도 - 거리, 무게, 시간 2. 자료의 형태 자료의 형태는 양적자료와 질적.. 2023. 12. 29.
[기초통계학] Chapter 1. 통계학이란 무엇인가? 1. 통계학의 정의 ​ 관심 또는 연구의 대상이 되는 모집단의 특성을 파악하기 위해, 모집단으로부터 일부의 자료(표본)를 수집하고 수집된 표본을 정리 · 요약 · 분석하여 표본의 특성을 파악한 후, 표본의 특성을 이용하여 모집단의 특성에 대한 원리와 방법을 제공하는 학문 2. 통계학의 기본용어 (1) 변수와 자료 1) 정보 정보란 일상생활에서 접하는 사실과 현상을 의미를 가지는 것으로 변환한 것 ▶ 양적정보 : 숫자로 표현할 수 있는 사실이나 현상(ex. 국민총생산, 주가 등) ▶ 질적정보 : 성질 또는 특성을 나타내는 사실과 현상(ex. 성별, 취미, 선호도 등) 2) 변수 변수란 숫자로 표현된 정보 중 그 값이 변화하는 것 ▶ 양적변수 : 숫자로 표현할 수 있는 변수(ex. 시험성적, 키, 몸무게 등.. 2023. 12. 29.