본문 바로가기

딥러닝을 위한 수학/확률과 통계

확률분포표에서 평균, 분산, 표준편차(Feat. Mean, Variance, Standard Deviation,도수 분포표,이산 확률 분포)

도수 분포표( frequency distribution )

위 그림에서 [ X : 변량(Variant), F : (빈)도수(Frequency) ] 를 뜻한다. 

만약 Frequency Distribution(도수 분포표)를 이용하여 평균(Mean)을 구해야 한다면

평균(Mean) = ( 모든 [X * F]의 합 ) / 10 

 

이산확률 분포(Probability Distribution)

우선, 결론부터 말하면, 확률 분포표(Probablity Distribution)으로부터 평균,분산,표준편차를 구할 수가 있다. 

X(확률 변수[random variable])=60에 대한 확률(P)는 [P = Frequency / Sum Of Frequency]

( 확률 분포표(Probablity Distribution)에서 X는 더이사 변량(Variant)라고 부르지 않고 확률 변수( random[stochastic]

variable) 라고 부른다.)

우리는 확률 분포표(Probablity Distribution)으로부터 평균(Mean)을 구할 수가 있다

1] 평균(Mean) = ( 모든 [X * P]의 합 ) -> 10으로 나눌 필요가 없다

2] 분산(Variance) = 모든 [ (X^2) * P 의 합 ] - M^2 (  https://jbluke.tistory.com/531의 분산(Variance) 참조 )

3] 표준 편차(Standard Deviation) = 2]의 분산값의 루트값

그러나 확률 분포(Probability Distribution)에서는 평균을 M, 분산을 V, 표준 편차를 시그마로 표현하지 않는다. 

평균 = E(x) 

-> E는 Expectation의 약자이다. 즉, 평균(Mean)을 기대값(Expectation)이라고 표현한다. 문득, 평균을 기대값이라고 부

르는 걸까?? 예시를 들어 보자

부모님들은 우리가 시험에서 90 이상을 받기를 기대(Expectation)한다. 이때의 90점은 평균이다. 이런 의미에서 평균을 기

대값이라고 부른다. 

분산 = V(x) or 시그마^2(x)

표준 편차 = 시그마(x)

 

예제 

동전을 2번 던져서 앞면이 나오는 횟수를 확률 변수(X)라고 했을 때 E(x),V(x)와 시그마(x)를 구하여라

 

이산확률 분포(Probability Distribution)

확률 분포표를 그리면 된다.

그 결과 E(x) = 1, V(x) = 1/2, 시그마(x) = (루트 2) / 2

 

확률질량함수(Probability Mass Function)

 

확률 질량 함수(Probablity Mass Function)

그냥, 이산 확률 변수(X)에 대한 확률값(Probability)을 구하는 함수이다. 

이산 확률 분포표

 

E(aX+b), V( aX+b ), 시그마( aX+b )의 특성

1] E(aX+b) = a*E(X) + b

2] V( aX + b) = a^2 * V(X)

3] 시그마(aX + b) =  V( aX + b)의 루트 = |a| * 시그마(X)

 

산포도(Scatter)와 E(aX+b), V( aX+b ), 시그마( aX+b )의 관계

-> 결론부터 말하면, a(계수)는 산포도(scatter)에 변화를 줄 수 있지만, b는 산포도(scatter)에 전혀 영향을 주지 X 

1] E( aX+b )

Ex) (a = 1, b= 10)의 경우 E(X+10)이 된다. 

이는 E(x) + 10으로 변환이 가능하다. 이 식의 의미는 곧 (평균+10)을 의미한다. 이때, 산포도(scatter)에 변화가 생기는 지

확인해보자. 

 

X가 +10(b)만큼 위로 평행 이동이 되면, E(X+10) = E(X) + 10에 의해 평균(m)도 +10만큼 같이 올라간다.

산포도(scatter)는 평균선에서 변량(X)가 얼마나 떨어져 있는지를 알기 위한 개념이다. 

그러나 b(=10) 값이 변하면, 평균도 같이 올라가기 때문에, 분산(Variance), 표준 편차(Standard Deviation)에 전혀 영향을

주지 못한다. 즉, b값은 전혀 산포도(scatter)에 영향을 주지 못한다. 

2] V(aX + b) = a^2 * V(X)

-> 위 식에서도 나타나듯이, b값은 전혀 산포도(scatter)에 영향을 주지 못한다.