통계학 - 자료의 정리1
자료의 정리 1. 표본 평균 n개의 자료가 있고 첫번째 자료를 $x_{1}$, n번째 자료를 $x_{n}$이라 할때 [\overline{x} = \frac{1}{n} \sum_{i=1}^{n} x_{i}] 기하학적으로 보면 n개의 값의 무게 중심 2. 표본 중간값 n개의 자료를 작은 것으로부터 크기 순으로 나열하였을 때 가운데에 있는 값 n이...
자료의 정리 1. 표본 평균 n개의 자료가 있고 첫번째 자료를 $x_{1}$, n번째 자료를 $x_{n}$이라 할때 [\overline{x} = \frac{1}{n} \sum_{i=1}^{n} x_{i}] 기하학적으로 보면 n개의 값의 무게 중심 2. 표본 중간값 n개의 자료를 작은 것으로부터 크기 순으로 나열하였을 때 가운데에 있는 값 n이...
모집단과 표본, 자료의 종류 1. 모집단(Population) 원래 실제로 알고 싶은 데이터를 말한다. 가령 우리나라 투표 가능 인구의 정치 성향을 조사하고 싶을때 여기서 “투표 가능 인구”가 모집단이다. 2. 표본(Sample) 모집단에서 일부 뽑아온 값이다. 이렇게 뽑아오는 행동을 표본추출(Sampling)이라고 한다. 실제적으로 통계는 이 표...
통계학 1. 개요 대학교 1학년때 통계학을 수강했고 들었던 기억도 있지만 지금 좀 생각해보니 가물가물한 부분이 있어서 다시 공부를 할까한다. 공부하면서 정리하는 내용에 대해서 추가적인 포스팅을 진행할 예정이다. 포스팅 목차는 아래와 같다. 2. 목차 1) 모집단과 표본 2) 자료의 정리 3) 확률 4) 확률변수, 확률분포, 기댓값 5) 분산, 누적...
MongoDB aggregation MongoDB에서 제공하는 가장 강력한 기능이다. find 기능의 확장판이라고도 볼수 있지만 실상은 원하는 정보를 찾아서 가공하는 집계 함수라고 할 수 있다. 장단점 이 기능의 장점과 단점은 아래와 같다. 장점 단순히 데이터를 찾고 자르는게 그치는 find 함수보다 더 다양한 편집 기능을 지원한다. 단점...
인덱스 지정 DB의 스키마 구조를 설계하고 DB를 운영하는데 있어서 빠질 수 없는게 바로 인덱스 설정이다. MongoDB라고 해서 이게 크게 다르지 않는데, 이러한 인덱스 설정을 어떤 기준으로 하면 좋고 어떻게 하는지 세부적으로 알아보도록 하겠다. Index의 구조 기본적으로 MongoDB의 Index는 B-tree를 이용해서 구성된다. 이는 이진트...
샤딩(Sharding) 수직 확장 vs 수평 확장 일반적으로 수직확장이라고 하면 단일 서버의 CPU 성능이나 RAM, 하드디스크의 용량을 늘리는 것이고 수평 확장이라고하면 물리적인 서버를 한대 더 두는 것을 뜻한다. 이렇게만 들으면 서버를 한 대 더 사는것보다 단일 서버 성능을 늘리는게 돈이나 노력면에서 훨씬 낫지 않느냐고 말할 수 있겠지만 일반적...
MongoDB ReplicaSet Replica set 물리적인 복사본을 가지고 DB를 운용하는 것이다. 어째서 이렇게 복사본을 운용하는가 하면 총 세가지 이유가 있다. 높은 가용성 다수의 복사본이 있기 때문에 서버 한 개가 셧다운 되어도 다른 서버가 읽거나 쓰는 기능을 대신할 수 있기 때문에 가용성에는 문제가 없다. 단, 데이터 정합성 때문에 주(...
리눅스 커널 컴파일 이번 포스팅에서는 리눅스 커널을 빌드하고 설치해보도록 하겠다. 진행환경 1. 하드웨어 CPU : 11th Gen Intel(R) Core(TM) i7-1165G7 @ 2.80GHz 2.80 GHz MEMORY : 16GB 2. Host OS Windows 10 Home 3. VM 환경 VM 환경 : VMware...
MongoDB 사용하기 MongoDB와 연결하기 어떤 플랫폼을 기반으로 사용할지 정해야한다. 많은 플랫폼을 지원하지만 Nodejs와 Python에 대해서만 다뤄보겠다. Nodejs Nodejs에서 제공하는 MongoDB 드라이버는 두 개이다. MongoDB Client MongoDB에서 제공하는 공식 드라이버이다. const { MongoClien...
필드 타입 MongoDB는 아래와 같은 필드 타입을 지원한다. double 소수점 자리이다. 소수를 입력하면 다음의 타입으로 지정된다. string 문자열 타입이다. UTF-8로 변환하여 저장된다. object 임의로 Object로 지정할 수 있다. 대부분 JSON으로 많이 쓴다. array 배열을 넣을 수 있다. 이 배열 내부 요소들은 doub...