통계학 - 통계적 추론 - 가설검정
통계적 가설검정 1. 가설 아직 증명되지 않은 문제에 대하여 문장으로 설정한 것 2. 통계적 가설 가설의 참과 거짓을 귀납법, 연역법으로 증명할 수 없고 관련된 통계 자료를 이용하여 가장 가능성이 높은 결론을 내리고자 하는 것. 3. 통계적 가설 검정 절차 1) 귀무가설과 대립가설을 세운다. $H_{0}$ : 부정하고 싶은 문장 (귀무가설 : ...
통계적 가설검정 1. 가설 아직 증명되지 않은 문제에 대하여 문장으로 설정한 것 2. 통계적 가설 가설의 참과 거짓을 귀납법, 연역법으로 증명할 수 없고 관련된 통계 자료를 이용하여 가장 가능성이 높은 결론을 내리고자 하는 것. 3. 통계적 가설 검정 절차 1) 귀무가설과 대립가설을 세운다. $H_{0}$ : 부정하고 싶은 문장 (귀무가설 : ...
통계적 추론 모집단에서부터 표본을 추출하여 모집단의 특성을 나타내는 모수(알려져 있지 않은 상수)에 대한 여러가지 정보를 얻기 위한 일련의 과정 통계적 추론 = 추정(estimation)[점 추정(point estimation) + 구간 추정 (interval estimation)] + 가설검정(test of hypotheses) 1. 점 추정 추...
1. 지수 분포(Exponential distribution) 첫사건이 발생하는데 걸리는 시간분포이다. 여기서 말하는 첫사건이란 사건이 일어날 횟수가 포아송 분포를 따른 다는 가정하에 이 사건이 처음 일어나는데 걸리는 시간이나 임의의 사건이 일어나고 다음 사건이 일어나기까지의 시간으로 앞서 말한 시간들은 지수분포를 따른다. 1) 확률 밀도 함수 여기...
1. 포아송 분포 단위 시간 또는 단위 공간에서 해당 사건이 몇 번 발생 할 것인가를 모델링하는 이산 확률 분포이다. 1) 확률 질량 함수, 평균, 분산 확률변수 X가 평균 m인 포아송 분포를 따를 때 확률질량함수는 [f(x)=\frac{e^{-m}m^{x}}{x!}, x=0,1,2,…] 평균과 분산은 [\mu = \sigma ^{2} = m]...
1. 베르누이 시행 성공과 실패 중 하나로 나타나는 시행으로 아래와 같은 특징을 가질때 베르누이 시행이라 부른다. 각 시행에서는 성공 확률 p=P(S)은 동일해야 한다. 각 시행은 서로 독립이어야 한다. EX) 동전 던지기를 할 때 앞면이 성공, 뒷면이 실패로 정의될 경우 2. 베르누이 분포 베르누이 분포란 단 한번의 베르누이 시행에 ...
1. 분산(Variance) 데이터의 흩어진 정도를 나타내는 통계적 측도이다. 데이터 값과 평균 간의 편차를 제곱한 값들을 평균해서 구한다. 데이터가 아닌 확률변수의 분산은 확률분포에서 확률변수의 변동성으로 확률 변수와 기댓값의 차이를 제곱한 값의 기댓값이다. [\sigma ^{2} = Var(X) = E((X-E(X))^{2}) = E(X^...
1. 확률 변수(Random variable) 표본공간에서 정의된 함수, 즉 표본 공간의 각 단위사건에 실 수 값을 부여하는 함수이다. 흔히들 X,Y,Z등으로 표현한다. 이렇게 이야기하면 잘 와닿지 않는데, 예를 들어보자 주사위를 던졌을 때 나오는 값의 합을 확률 변수 X라고 둔다면 한번 던졌을 때 X=1,2,3,4,5,6 일 것이고, 두번 던지면...
확률 1. 기본 정의 1) 실험(Experiment) 실행하기 전에는 그 결과를 알 수 없는 행위 2) 표본 공간(Sample space) 실험을 하였을 때 나타날 수 있는 모든 결과를 모은 집합 (S) 3) 단순 (단위) 사건(Simple event, Elementary event) 표본 공간의 원소 하나 하나 ($e_{1},…,e_{n}$) ...
이변량 자료와 상관계수 1. 변수 개수에 따른 분류 1) 일변량 자료(univariate data) 하나의 변수에 대한 자료 2) 이변량 자료(bivariate data) 두개의 변수에 대한 자료 3) 다변량 자료(multivariate data) 여러 개의 변수에 대한 자료 2. 자료 분석 1) 두 변수가 모두 질적 자료인 경우 첫번째 자료는...
자료의 정리 1. 표본 평균 n개의 자료가 있고 첫번째 자료를 $x_{1}$, n번째 자료를 $x_{n}$이라 할때 [\overline{x} = \frac{1}{n} \sum_{i=1}^{n} x_{i}] 기하학적으로 보면 n개의 값의 무게 중심 2. 표본 중간값 n개의 자료를 작은 것으로부터 크기 순으로 나열하였을 때 가운데에 있는 값 n이...