머신러닝(MACHINE LEARNING)/통계(Statistics)
-
정규 분포 (Gaussian Distribution)머신러닝(MACHINE LEARNING)/통계(Statistics) 2021. 6. 8. 17:26
0. 서론 - 정규분포는 18세기 후반 과 19세기 초반의 위대한 독일의 수학자 카를 프리드리히 가우스이 이름을 따 가우스 분포 Gaussinan_Distribution 이라고도 불리는데, 다음과 같은 공식을 따른다. 1. 공식 가우시안 정규분포를 그려보게 되면 다음과 같은 형태를 띄게 된다. from numpy import random import seaborn as sns sns.distplot(random.normal(size=1000), hist=False) plt.show() 2. 정규분포의 정규화(Normalized) 확인 - 정규분포가 정규화 즉, 다음을 만족시키는지 확인해보자. - 제일 간단한 형태부터 시작하기 위해서 \( u = 0 \), 즉 평균은 0일 때부터 확인해보자. - \( u ..
-
역변환 방법( Inverse CDF Technique)머신러닝(MACHINE LEARNING)/통계(Statistics) 2021. 6. 8. 14:36
0. 서론 - 컴퓨터를 쓰다 보면, 생각보다 난수를 일으킬 일들이 많이 있다. 이럴때, 보통 python 의 경우, random.random( ) 모듈을 사용하게 되면, 0~1 사이 분포의 난수가 일어나게 되는데, 그렇다면, 어떤 특정한 함수를 따르는 난수를 만들어 내고 싶다면, 어떻게 해야 할까? 라는 의문에서 이 역변환 방법(inverse CDF technique) 이 쓰이게 된다. 1. 기본적인 난수 생성기 - 앞서 말했듯, 가장 기본적인 난수 생성기는 균등분포(uniform dist.) 난수생성기이다. 따라서 이것만 가지고는 0~1 사이의 난수만 생성할 수 있지, 다른 특정한 PDF 를 가지는 난수를 생성하기는 힘들다. 하지만, 역변환 방법(Inverse CDF) 을 사용하게 된다면, 우리는 어떠..