본문 바로가기

분류 전체보기

이항 분포와 정규분포의 관계(Feat. 드 누아브르-라플라스 정리) 예시를 들어 보자 주사위를 450번 던져서 "3의 약수"가 나온 횟수를 X라고 하자. 이때, 우리는 B(450, 2/6)를 이용하여 손쉽게 평균,분산, 표준편차를 구할 수가 있다. 그러나 만약 "3의 약수"가 45번 이상 나올 확률을 구하라 라고 나오면 어떻게 해야 할까? 만약 X가 이산적이 아니라, 연속적이면 확률 밀도 함수의 특성에 따라, 정규 분포 그래프를 이용해서 면적을 구하면 된다. 그러나 '횟수'라는 것은 연속적아니라 이산적이다. 그렇다면 방법은, 소위 거대한 표를 그려서 X의 범위 40~450까지의 확률을 구해서 다 더해야 할까? 너무나도 많은 연산량을 필요로 하게 된다. 드 누아브르와 라플라스라는 사람은, 이와 같이 이항 분포와 정규 분포의 관계를 정의를 했다. 시행 횟수가 충분히 클 때,.. 더보기
정규 분포(Normal Distribution)와 표준화(Feat. 확률 밀도 함수,표준 정규분포표) 정규 분포(Normal Distribution)의 3가지 성립 조건 1] 확률 밀도 함수 2] 평균(m)을 기준으로 좌우 대칭 3 ] 그래프의 넓이가 1 정규 분포의 특성 -> 평균(m)에 데이터가 많이 모여 있고, 양극단으로 갈 수록 데이터가 극단적으로 적어진다. 대부분의 확률 밀도 함수의 형태는 정규 분포 그래프의 형태를 띈다. 그럼, 정규 분포는 어떻게 표현할 수가 있을까? 이항 분포(Binomial Distribution)의 경우, B(n,p)로 이항 분포표를 압축하여 표현할 수가 있었다. 정규 분포 그래프도 딱 2가지 요소만으로 그래프를 표현(가늠)할 수가 있다. 바로, 평균(m)값과 표준 편차(or 분산)이다. 고로, 정규 분포는 N( m, 분산)로 정의된다. 위에서 언급했듯이, 정규 분포(N.. 더보기
연속 확률 변수(Continuous Probability Variables) 확률 밀도 함수(Probability Density Function) 여태까지는 확률 분포'표'를 만들 수가 있었다. 그 이유는 X가 Discrete Probability Variables, 즉 뚝뚝 떨어져 있는 값이 이산 확률 변수였기 때문이다. 그러나 연속적인 변수는 연속 확률 변수(Continuous Probability Variables)는 X의 범위가 무한이기에 표로 더이상 나타낼 수가 없고, 그래프로 표현을 해야 한다. 이산 확률 변수(Discrete Probability Variables) : 확률 변수가 이산적이여서 표로 표현 연속 확률 변수(Continuous Probability Variables) : 확률 변수가 연속적이여서 그래프로 표현확률 질량 함수(Probability Mass Function) : 이산 확률 변수'표'에서 얻어진 확률 변수와 확률.. 더보기
이항 분포표(Binomial Distribution)(Feat. 거대한 표, 확률 분포) 예시를 하나 들자 주사위를 무려 1만번 던졌을 때, "1이 나온 횟수"를 X라고 했을 때, E(X), V(X), 시그마(X)를 구해보자. 확률 분포표를 그려보자. 확률 변수(X)의 범위는 0 , 1, 2 , 3, 4, 5, ........9999, 10000이고, 그에 따른 P 값은 각각 10000_C_0 * (1/6)^0 * (6/5)^10000 , 10000_C_1 * (1/6)^1 * (6/5)^9999, 10000_C_2 * (1/6)^2 * (6/5)^9998 ........... 10000_C_10000 * (1/6)^10000 * (6/5)^0 (참고로, 위 확률은 독립 시행임에 유의하자) 이건 계산량이 많은 거대한 표(비공식 용어)이다. 이걸 확률 분포표를 그려서 E(X), V(X), 시그.. 더보기
확률분포표에서 평균, 분산, 표준편차(Feat. Mean, Variance, Standard Deviation,도수 분포표,이산 확률 분포) 위 그림에서 [ X : 변량(Variant), F : (빈)도수(Frequency) ] 를 뜻한다. 만약 Frequency Distribution(도수 분포표)를 이용하여 평균(Mean)을 구해야 한다면 평균(Mean) = ( 모든 [X * F]의 합 ) / 10 우선, 결론부터 말하면, 확률 분포표(Probablity Distribution)으로부터 평균,분산,표준편차를 구할 수가 있다. X(확률 변수[random variable])=60에 대한 확률(P)는 [P = Frequency / Sum Of Frequency] ( 확률 분포표(Probablity Distribution)에서 X는 더이사 변량(Variant)라고 부르지 않고 확률 변수( random[stochastic] variable) 라고 .. 더보기
AI 모델 테스트 용 동영상 자료 저장소(Feat. 비디오,mp4, 영상, dataset) https://www.pexels.com/videos/ 우리가 예를 들어서, 얼굴 인식 AI 모델 혹은 사물 인식 AI 모델을 주로 웹캠과 같은 디바이스와 연결하여 실제로 서비스를 제공한다. 그러나 그러한 디바이스가 없는 상황에서는 AI 모델을 테스트하기가 곤란한다. 위 사이트에서는 mp4 파일 형태로 테스트용 동영상을 제공한다. 더보기
OpenCV GPU 연동(Feat. Cmake, Cuda toolkit, cudnn) https://prlabhotelshoe.tistory.com/24 [CUDA&OpenCV] Python 환경 OpenCV GPU 연동 (CUDA backend in OpenCV) - 1. 파일 설치 컴퓨터 비전 등을 공부할 때 자주 접하게 되는 OpenCV 이에 대한 여러 블로그나 기타 웹에서 샘플 코드를 학습할 때, GPU와의 연동으로 빠른 처리를 시도해 볼 수 있으며 간단한 코드 작성으로 실행 prlabhotelshoe.tistory.com https://prlabhotelshoe.tistory.com/26#google_vignette [CUDA&OpenCV] Python 환경 OpenCV GPU 연동 (CUDA backend in OpenCV) - 2. 빌드 & 테스트 지난 포스팅에서 빌드를 위한.. 더보기
yolov5을 사용하기 위한 Pytorch gpu 연동(Feat. CUDA,cudnn) (이 페이지는 yolov5를 이용한 Object detection 프로젝트(https://github.com/jinyoungkimm/yolov5_project.git)을 하다가 생 긴 궁금즘 해결을 위한 페이지이다 ) AI 프레임워크에는 크게 2가지 종류가 있다. 1. Tensorflow - Google에서 제작 2. Pytorch - Meta(facebook)에서 제작 근데, yolov5부터는 Pytorch를 기반으로 개발되었다. (이걸 몰라서 yolov5를 사용하기 위하여 계속 tensorflow 패키지를 설치하는 삽질을 했다.ㅠㅠ) Pytorch 패키지를 GPU와 연동하기 위해서는 tensorflow와 같이 CUDA, cudnn을 설치해야 한다. CUDA, cudnn을 수동으로 설치하여, 시스템 환.. 더보기