통계학 - 회귀분석 개요
회귀분석 1. 개요 간단하게 말하자면 원인과 결과간에 어떤 상관관계가 있는지 추정하는 것이다. 수학으로 따지자면 함수이며, 입력값과 출력값이 주어졌을때 어떤 함수인지 추정하는 것이다. 단, 특정 수학 공식과 같이 오차없이 명확하게가 아닌 필연적으로 오차를 수반한다는 점이 다르다. 좀 더 명시적으로 명료하게 표현하자면 아래와 같은 형태로 나타...
회귀분석 1. 개요 간단하게 말하자면 원인과 결과간에 어떤 상관관계가 있는지 추정하는 것이다. 수학으로 따지자면 함수이며, 입력값과 출력값이 주어졌을때 어떤 함수인지 추정하는 것이다. 단, 특정 수학 공식과 같이 오차없이 명확하게가 아닌 필연적으로 오차를 수반한다는 점이 다르다. 좀 더 명시적으로 명료하게 표현하자면 아래와 같은 형태로 나타...
쌍체 비교 (Matched Pair Comparisons) 모집단이 서로 독립이 아닐 경우, 즉 모집단의 데이터가 pair를 이룰 경우 어떻게 비교하는가에 대한 내용이다. 자료에 대한 가정 $D_{1},…,D_{n}$ : 임의 표본(단, $D_{i}=X_{i}-Y_{i}, i=1,…,n$) 통계량 표본 평균 : $ \overline{D} = ...
독립 이표본 검정 1. 대표본 두 개의 모집단이 있다. 이 두 개의 모집단은 서로 독립이고 각각의 모집단에서 추출한 25개 이상의 표본(대표본)을 아래와 같이 정의했다. 첫번째 모집단에서 $n_{1}$개를 뽑은 표본1 \(X_{1},X_{2},...,X_{n_{1}}\) 두번째 모집단에서 $n_{2}$개를 뽑은 ...
분산의 추론 개요 표본 $X_{1}, X_{2}…, X_{n}$이 $N(\mu,\sigma ^{2})$로를 따르면 임의 표본이라고 할때 모분산을 추론한다. 이때 점추정치은 표본분산 값이된다. [s^{2} = \frac{1}{n-1}\sum (X_{i}-\overline{X})^{2}] 구간 추정을 통해 신뢰구간을 구하려면 이야기가 조금 다른데,...
통계적 가설검정 1. 가설 아직 증명되지 않은 문제에 대하여 문장으로 설정한 것 2. 통계적 가설 가설의 참과 거짓을 귀납법, 연역법으로 증명할 수 없고 관련된 통계 자료를 이용하여 가장 가능성이 높은 결론을 내리고자 하는 것. 3. 통계적 가설 검정 절차 1) 귀무가설과 대립가설을 세운다. $H_{0}$ : 부정하고 싶은 문장 (귀무가설 : ...
통계적 추론 모집단에서부터 표본을 추출하여 모집단의 특성을 나타내는 모수(알려져 있지 않은 상수)에 대한 여러가지 정보를 얻기 위한 일련의 과정 통계적 추론 = 추정(estimation)[점 추정(point estimation) + 구간 추정 (interval estimation)] + 가설검정(test of hypotheses) 1. 점 추정 추...
1. 지수 분포(Exponential distribution) 첫사건이 발생하는데 걸리는 시간분포이다. 여기서 말하는 첫사건이란 사건이 일어날 횟수가 포아송 분포를 따른 다는 가정하에 이 사건이 처음 일어나는데 걸리는 시간이나 임의의 사건이 일어나고 다음 사건이 일어나기까지의 시간으로 앞서 말한 시간들은 지수분포를 따른다. 1) 확률 밀도 함수 여기...
1. 포아송 분포 단위 시간 또는 단위 공간에서 해당 사건이 몇 번 발생 할 것인가를 모델링하는 이산 확률 분포이다. 1) 확률 질량 함수, 평균, 분산 확률변수 X가 평균 m인 포아송 분포를 따를 때 확률질량함수는 [f(x)=\frac{e^{-m}m^{x}}{x!}, x=0,1,2,…] 평균과 분산은 [\mu = \sigma ^{2} = m]...
1. 베르누이 시행 성공과 실패 중 하나로 나타나는 시행으로 아래와 같은 특징을 가질때 베르누이 시행이라 부른다. 각 시행에서는 성공 확률 p=P(S)은 동일해야 한다. 각 시행은 서로 독립이어야 한다. EX) 동전 던지기를 할 때 앞면이 성공, 뒷면이 실패로 정의될 경우 2. 베르누이 분포 베르누이 분포란 단 한번의 베르누이 시행에 ...
1. 분산(Variance) 데이터의 흩어진 정도를 나타내는 통계적 측도이다. 데이터 값과 평균 간의 편차를 제곱한 값들을 평균해서 구한다. 데이터가 아닌 확률변수의 분산은 확률분포에서 확률변수의 변동성으로 확률 변수와 기댓값의 차이를 제곱한 값의 기댓값이다. [\sigma ^{2} = Var(X) = E((X-E(X))^{2}) = E(X^...