통계학 - 베르누이 시행과 분포, 이항분포
1. 베르누이 시행 성공과 실패 중 하나로 나타나는 시행으로 아래와 같은 특징을 가질때 베르누이 시행이라 부른다. 각 시행에서는 성공 확률 p=P(S)은 동일해야 한다. 각 시행은 서로 독립이어야 한다. EX) 동전 던지기를 할 때 앞면이 성공, 뒷면이 실패로 정의될 경우 2. 베르누이 분포 베르누이 분포란 단 한번의 베르누이 시행에 ...
1. 베르누이 시행 성공과 실패 중 하나로 나타나는 시행으로 아래와 같은 특징을 가질때 베르누이 시행이라 부른다. 각 시행에서는 성공 확률 p=P(S)은 동일해야 한다. 각 시행은 서로 독립이어야 한다. EX) 동전 던지기를 할 때 앞면이 성공, 뒷면이 실패로 정의될 경우 2. 베르누이 분포 베르누이 분포란 단 한번의 베르누이 시행에 ...
1. 분산(Variance) 데이터의 흩어진 정도를 나타내는 통계적 측도이다. 데이터 값과 평균 간의 편차를 제곱한 값들을 평균해서 구한다. 데이터가 아닌 확률변수의 분산은 확률분포에서 확률변수의 변동성으로 확률 변수와 기댓값의 차이를 제곱한 값의 기댓값이다. [\sigma ^{2} = Var(X) = E((X-E(X))^{2}) = E(X^...
1. 확률 변수(Random variable) 표본공간에서 정의된 함수, 즉 표본 공간의 각 단위사건에 실 수 값을 부여하는 함수이다. 흔히들 X,Y,Z등으로 표현한다. 이렇게 이야기하면 잘 와닿지 않는데, 예를 들어보자 주사위를 던졌을 때 나오는 값의 합을 확률 변수 X라고 둔다면 한번 던졌을 때 X=1,2,3,4,5,6 일 것이고, 두번 던지면...
확률 1. 기본 정의 1) 실험(Experiment) 실행하기 전에는 그 결과를 알 수 없는 행위 2) 표본 공간(Sample space) 실험을 하였을 때 나타날 수 있는 모든 결과를 모은 집합 (S) 3) 단순 (단위) 사건(Simple event, Elementary event) 표본 공간의 원소 하나 하나 ($e_{1},…,e_{n}$) ...
이변량 자료와 상관계수 1. 변수 개수에 따른 분류 1) 일변량 자료(univariate data) 하나의 변수에 대한 자료 2) 이변량 자료(bivariate data) 두개의 변수에 대한 자료 3) 다변량 자료(multivariate data) 여러 개의 변수에 대한 자료 2. 자료 분석 1) 두 변수가 모두 질적 자료인 경우 첫번째 자료는...
자료의 정리 1. 표본 평균 n개의 자료가 있고 첫번째 자료를 $x_{1}$, n번째 자료를 $x_{n}$이라 할때 [\overline{x} = \frac{1}{n} \sum_{i=1}^{n} x_{i}] 기하학적으로 보면 n개의 값의 무게 중심 2. 표본 중간값 n개의 자료를 작은 것으로부터 크기 순으로 나열하였을 때 가운데에 있는 값 n이...
모집단과 표본, 자료의 종류 1. 모집단(Population) 원래 실제로 알고 싶은 데이터를 말한다. 가령 우리나라 투표 가능 인구의 정치 성향을 조사하고 싶을때 여기서 “투표 가능 인구”가 모집단이다. 2. 표본(Sample) 모집단에서 일부 뽑아온 값이다. 이렇게 뽑아오는 행동을 표본추출(Sampling)이라고 한다. 실제적으로 통계는 이 표...
통계학 1. 개요 대학교 1학년때 통계학을 수강했고 들었던 기억도 있지만 지금 좀 생각해보니 가물가물한 부분이 있어서 다시 공부를 할까한다. 공부하면서 정리하는 내용에 대해서 추가적인 포스팅을 진행할 예정이다. 포스팅 목차는 아래와 같다. 2. 목차 1) 모집단과 표본 2) 자료의 정리 3) 확률 4) 확률변수, 확률분포, 기댓값 5) 분산, 누적...
MongoDB aggregation MongoDB에서 제공하는 가장 강력한 기능이다. find 기능의 확장판이라고도 볼수 있지만 실상은 원하는 정보를 찾아서 가공하는 집계 함수라고 할 수 있다. 장단점 이 기능의 장점과 단점은 아래와 같다. 장점 단순히 데이터를 찾고 자르는게 그치는 find 함수보다 더 다양한 편집 기능을 지원한다. 단점...
인덱스 지정 DB의 스키마 구조를 설계하고 DB를 운영하는데 있어서 빠질 수 없는게 바로 인덱스 설정이다. MongoDB라고 해서 이게 크게 다르지 않는데, 이러한 인덱스 설정을 어떤 기준으로 하면 좋고 어떻게 하는지 세부적으로 알아보도록 하겠다. Index의 구조 기본적으로 MongoDB의 Index는 B-tree를 이용해서 구성된다. 이는 이진트...