위 그림에서 [ X : 변량(Variant), F : (빈)도수(Frequency) ] 를 뜻한다.
만약 Frequency Distribution(도수 분포표)를 이용하여 평균(Mean)을 구해야 한다면
평균(Mean) = ( 모든 [X * F]의 합 ) / 10
우선, 결론부터 말하면, 확률 분포표(Probablity Distribution)으로부터 평균,분산,표준편차를 구할 수가 있다.
X(확률 변수[random variable])=60에 대한 확률(P)는 [P = Frequency / Sum Of Frequency]
( 확률 분포표(Probablity Distribution)에서 X는 더이사 변량(Variant)라고 부르지 않고 확률 변수( random[stochastic]
variable) 라고 부른다.)
우리는 확률 분포표(Probablity Distribution)으로부터 평균(Mean)을 구할 수가 있다.
1] 평균(Mean) = ( 모든 [X * P]의 합 ) -> 10으로 나눌 필요가 없다.
2] 분산(Variance) = 모든 [ (X^2) * P 의 합 ] - M^2 ( https://jbluke.tistory.com/531의 분산(Variance) 참조 )
3] 표준 편차(Standard Deviation) = 2]의 분산값의 루트값
그러나 확률 분포(Probability Distribution)에서는 평균을 M, 분산을 V, 표준 편차를 시그마로 표현하지 않는다.
평균 = E(x)
-> E는 Expectation의 약자이다. 즉, 평균(Mean)을 기대값(Expectation)이라고 표현한다. 문득, 평균을 기대값이라고 부
르는 걸까?? 예시를 들어 보자
부모님들은 우리가 시험에서 90 이상을 받기를 기대(Expectation)한다. 이때의 90점은 평균이다. 이런 의미에서 평균을 기
대값이라고 부른다.
분산 = V(x) or 시그마^2(x)
표준 편차 = 시그마(x)
예제
동전을 2번 던져서 앞면이 나오는 횟수를 확률 변수(X)라고 했을 때 E(x),V(x)와 시그마(x)를 구하여라
확률 분포표를 그리면 된다.
그 결과 E(x) = 1, V(x) = 1/2, 시그마(x) = (루트 2) / 2
확률질량함수(Probability Mass Function)
그냥, 이산 확률 변수(X)에 대한 확률값(Probability)을 구하는 함수이다.
E(aX+b), V( aX+b ), 시그마( aX+b )의 특성
1] E(aX+b) = a*E(X) + b
2] V( aX + b) = a^2 * V(X)
3] 시그마(aX + b) = V( aX + b)의 루트 = |a| * 시그마(X)
산포도(Scatter)와 E(aX+b), V( aX+b ), 시그마( aX+b )의 관계
-> 결론부터 말하면, a(계수)는 산포도(scatter)에 변화를 줄 수 있지만, b는 산포도(scatter)에 전혀 영향을 주지 X
1] E( aX+b )
Ex) (a = 1, b= 10)의 경우 E(X+10)이 된다.
이는 E(x) + 10으로 변환이 가능하다. 이 식의 의미는 곧 (평균+10)을 의미한다. 이때, 산포도(scatter)에 변화가 생기는 지
확인해보자.
X가 +10(b)만큼 위로 평행 이동이 되면, E(X+10) = E(X) + 10에 의해 평균(m)도 +10만큼 같이 올라간다.
산포도(scatter)는 평균선에서 변량(X)가 얼마나 떨어져 있는지를 알기 위한 개념이다.
그러나 b(=10) 값이 변하면, 평균도 같이 올라가기 때문에, 분산(Variance), 표준 편차(Standard Deviation)에 전혀 영향을
주지 못한다. 즉, b값은 전혀 산포도(scatter)에 영향을 주지 못한다.
2] V(aX + b) = a^2 * V(X)
-> 위 식에서도 나타나듯이, b값은 전혀 산포도(scatter)에 영향을 주지 못한다.
'딥러닝을 위한 수학 > 확률과 통계' 카테고리의 다른 글
이항 분포와 정규분포의 관계(Feat. 드 누아브르-라플라스 정리) (1) | 2024.02.02 |
---|---|
정규 분포(Normal Distribution)와 표준화(Feat. 확률 밀도 함수,표준 정규분포표) (0) | 2024.02.01 |
연속 확률 변수(Continuous Probability Variables) 확률 밀도 함수(Probability Density Function) (0) | 2024.02.01 |
이항 분포표(Binomial Distribution)(Feat. 거대한 표, 확률 분포) (0) | 2024.02.01 |
평균(Mean), 분산(Variance), 표준 편차(Standard Deviant) (0) | 2024.01.22 |