통계학 - 로지스틱 회귀 분석
로지스틱 회귀분석 1. 개요 일반적인 선형회귀는 표본이 양적자료일때 사용했었다. 하지만 질적자료(범주형 자료라고도 불린다)일 경우에는 일반적인 선형 회귀를 적용하기 어렵다. 이는 결과값이 $ (-\infty , \infty )$로 나타나기 때문이다. 따라서 반응 변수 값이 0 또는 1로 나타나는 이진 변수나 혹은 1,2,3 등으로 제한되는 여러개로 ...
로지스틱 회귀분석 1. 개요 일반적인 선형회귀는 표본이 양적자료일때 사용했었다. 하지만 질적자료(범주형 자료라고도 불린다)일 경우에는 일반적인 선형 회귀를 적용하기 어렵다. 이는 결과값이 $ (-\infty , \infty )$로 나타나기 때문이다. 따라서 반응 변수 값이 0 또는 1로 나타나는 이진 변수나 혹은 1,2,3 등으로 제한되는 여러개로 ...
선형회귀분석 1. 단순 선형 회귀 분석 1) 필요한 정의 a. 참 모형 실제 전체 모든 경우를 포함한 모형 (현실세계에서는 불가) b. 설정모형 자료를 보고 임의의 형태를 대략적으로 표기한 모형 c. 적합모형 자료에서 가장 적합한 형태로 설정 모형을 조정한 모형 2) 단순 선형 회귀 모형 일차 방정식 형태로 나타나는 모형으로 직선 회귀 모형이...
회귀분석 1. 개요 간단하게 말하자면 원인과 결과간에 어떤 상관관계가 있는지 추정하는 것이다. 수학으로 따지자면 함수이며, 입력값과 출력값이 주어졌을때 어떤 함수인지 추정하는 것이다. 단, 특정 수학 공식과 같이 오차없이 명확하게가 아닌 필연적으로 오차를 수반한다는 점이 다르다. 좀 더 명시적으로 명료하게 표현하자면 아래와 같은 형태로 나타...
쌍체 비교 (Matched Pair Comparisons) 모집단이 서로 독립이 아닐 경우, 즉 모집단의 데이터가 pair를 이룰 경우 어떻게 비교하는가에 대한 내용이다. 자료에 대한 가정 $D_{1},…,D_{n}$ : 임의 표본(단, $D_{i}=X_{i}-Y_{i}, i=1,…,n$) 통계량 표본 평균 : $ \overline{D} = ...
독립 이표본 검정 1. 대표본 두 개의 모집단이 있다. 이 두 개의 모집단은 서로 독립이고 각각의 모집단에서 추출한 25개 이상의 표본(대표본)을 아래와 같이 정의했다. 첫번째 모집단에서 $n_{1}$개를 뽑은 표본1 \(X_{1},X_{2},...,X_{n_{1}}\) 두번째 모집단에서 $n_{2}$개를 뽑은 ...
분산의 추론 개요 표본 $X_{1}, X_{2}…, X_{n}$이 $N(\mu,\sigma ^{2})$로를 따르면 임의 표본이라고 할때 모분산을 추론한다. 이때 점추정치은 표본분산 값이된다. [s^{2} = \frac{1}{n-1}\sum (X_{i}-\overline{X})^{2}] 구간 추정을 통해 신뢰구간을 구하려면 이야기가 조금 다른데,...
통계적 가설검정 1. 가설 아직 증명되지 않은 문제에 대하여 문장으로 설정한 것 2. 통계적 가설 가설의 참과 거짓을 귀납법, 연역법으로 증명할 수 없고 관련된 통계 자료를 이용하여 가장 가능성이 높은 결론을 내리고자 하는 것. 3. 통계적 가설 검정 절차 1) 귀무가설과 대립가설을 세운다. $H_{0}$ : 부정하고 싶은 문장 (귀무가설 : ...
통계적 추론 모집단에서부터 표본을 추출하여 모집단의 특성을 나타내는 모수(알려져 있지 않은 상수)에 대한 여러가지 정보를 얻기 위한 일련의 과정 통계적 추론 = 추정(estimation)[점 추정(point estimation) + 구간 추정 (interval estimation)] + 가설검정(test of hypotheses) 1. 점 추정 추...
1. 지수 분포(Exponential distribution) 첫사건이 발생하는데 걸리는 시간분포이다. 여기서 말하는 첫사건이란 사건이 일어날 횟수가 포아송 분포를 따른 다는 가정하에 이 사건이 처음 일어나는데 걸리는 시간이나 임의의 사건이 일어나고 다음 사건이 일어나기까지의 시간으로 앞서 말한 시간들은 지수분포를 따른다. 1) 확률 밀도 함수 여기...
1. 포아송 분포 단위 시간 또는 단위 공간에서 해당 사건이 몇 번 발생 할 것인가를 모델링하는 이산 확률 분포이다. 1) 확률 질량 함수, 평균, 분산 확률변수 X가 평균 m인 포아송 분포를 따를 때 확률질량함수는 [f(x)=\frac{e^{-m}m^{x}}{x!}, x=0,1,2,…] 평균과 분산은 [\mu = \sigma ^{2} = m]...