본문 바로가기

딥러닝(Deep Learning)

사례 분류(Instance Classification) VS 범주 분류(Categorical Classification)(Feat. [컴퓨터 비전과 딥러닝] P 363 컴퓨터 비전의 인식(Recognition)의 한 분야인 분류는 사례 분류(Instance Classification)와 범주 분류(Categorical Classification)으로 크게 나뉜다. 사례 분류(Instance Classification)과 범주 분류(Categorical Classification)의 개념이 너무 헷갈려 다음과 같이 블로그에 정 리를한다. 결론부터 말을 하면, 사례 분류(Instance Classification)과 범주 분류(Categorical Classification)의 결정적 차이는 해당 Object의 분류 범위의 크기에 있다. 사례 분류(Instance Classification)은 특정한 물체를 알아내는 것. 범주 분류(Categorical Classifica.. 더보기
주요 데이터 셋 사이트(Feat. data sets, 클라우드 소싱, Mechanical Turk ) - 유명한 데이터 셋 -(컴퓨터 비전과 딥러닝 p 366) 1. Papers with Code 사이트 -> 딥러닝 관련 논문과 소스 코드, 데이터 셋을 제공. 강점으로는 데이터 셋별로 SOTA 성능의 역사적 추세를 그래프고 제시하여 현재 기술 수준을 가늠할 수가 있다. 2. 위키피디아(list of datasets for machine learning research) -> 여섯 그룹으로 구분돼 있고 그룹마다 수십 개의 데이터 셋을 소개한다. 3. tensorflow(http://www.tensorflow.org/datasets.org/datasets/catalog/overview) -> Image, Image classification, Object detection 데이터 셋으로 구분돼 있다. 4. .. 더보기
Class imbalance(클래스 불균형) 상황에서의 Cross-Entropy(GE)의 문제점(Feat. Focal Loss Function, 부류 불균형,focusing parameter, Easy Native, Hard Positive) (아래의 글을 읽기 전에 Object [Detection]에 대한 정확한 의미를 짚어 가자. 1.Object Detction : 여러 Object들을 Bounding Box를 통해 Localization(위치를 찾고)하고, Classification(어떤 물체인지 분류)하는 작업 2. 배경 BBox(Easy - Negative) : 배경에 대한 BBox의 갯수가 압도적으로 많으므로, Detector에 의해 검출되기는 Easy하지만, 출력의 결과는 [오류](=Negative)이다. 3. 객체 BBox(Hard - Negative) : 객체에 대한 BBox는 개수가 매우 적으므로 Dectector에 의해 검출되기 어렵렵고, 출력의 결과는 [정상](=Positive)이다. -> BBox와 같은 Example들.. 더보기
MSE의 Weight Update의 불공정성(Feat. 분류 문제, Cross-Entropy,softmax,로그우도(Log Likelihood)) (아래의 글을 읽기 전에, MSE랑 Cross-Entropy 설명 시, Activation Function을 모두 Sigmoid 함수로 가정하여 설명을 하고 있다) MSE(Mean Square Error) 정답 레이블이 INDEX=[0,1] 중 0인 상황에서 예측값(o)이 각각 [0.7503(idx=0), 0.9971(idx=1)] 나온 두 경우를 생각해보자. (위에서도 언급했듯이, sigmoid 함수를 가정하여 설명하고 있으므로, idx=0과 idx=1은 동시에 나오는 값이 아니다.) (참고로, sigmoid 함수는 Binary Classification 등에서 주로 사용된다) 후자(0.9971)가 조금 더 큰 에러가 발생했으므로, 더 큰 그레디언트 값을 이용하여 가중치(weight)를 갱신시켜 주어야.. 더보기
Hyper Paramater Tuning(Feat. 모델 최적화) Parameter(매개변수) vs Hyper Parameter(하이퍼 매개변수) Parameter (파라미터, 매개변수) Parameter는 모델 내부에서 결정되는 변수, 데이터를 통해서 산출이 가능한 값이며 학습 시 얻어지는 값이다. 모델 내부에서 데이터를 통해 구해진다. 예측을 수행할 때, 모델에 의해 요구되어지는 값 측정되거나 데이터로부터 학습되어진다. 학습된 모델의 일부로 저장되어진다. ex. 인공신경망에서의 가중치 계수(weight coefficient), SVM(서포트 벡터 머신)에서의 서포트 벡터, 선형회귀나 로지스틱회귀분석에서의 결정계수, 편향(bias) Hyperparameter (하이퍼파라미터, 초매개변수) Hyperparameter는 주로 알고리즘 사용자가 경험에 의해 직접 세팅하는 .. 더보기
connected Component Labeling(Feat. OpenCV,4 연결성, 8 연결성) https://swkdn.tistory.com/entry/6-%EC%98%81%EC%83%81%EB%B6%84%ED%95%A0Segmentation-%EC%98%81%EC%83%81%EA%B8%B0%EB%B0%98-%EC%B2%98%EB%A6%AC%EA%B8%B0%EB%B2%95 [6] 영상분할(Segmentation, 영상기반 처리기법) 목표 Image segmentation의 목적 및 필요성 Image segmentation 방법 Image Segmentation => 전체 영상을 객체 또는 의미 있는 객체의 일부 영역의 집합으로 구 분하는 과정 Categories of image segmentation techniques => 영 swkdn.tistory.com https://vision0814.t.. 더보기
cv.namedWindow, cv.setMouseCallback의 관계(Feat, winname, 윈도우 창 구분자) import cv2 as cv import numpy as np import sys img = cv.imread("2.jpg") if img is None: sys.exit("해당 파일을 찾지 못하였습니다.") def drawing(event,x,y,flags,param): global ix,iy if event == cv.EVENT_LBUTTONDOWN: ix,iy = x,y elif event == cv.EVENT_RBUTTONUP: cv.rectangle(img,(ix,iy),(x,y),(0,0,255),2) print("x",x,"y",y) cv.imshow("t2",img) cv.namedWindow("t1") cv.imshow("t1",img) cv.setMouseCallback("tittle.. 더보기
cv.CAP_DSHOW(Feat. DirectShow API,윈도우, Windows) cv.CAP_DSHOW의 DSHOW는 [Direct Show] API의 약자이며, DirectShow는 Microsoft Windows 운영 체제에서 멀티미디어 스트림을 처리하기 위한 아키텍처입니다. 따라서 cv.CAP_DSHOW는 OpenCV에서 Windows 환경에서 DirectShow API를 사용하여 카메라를 캡처하기 위한 상수입 니다. (개발 환경이 리눅스의 경우, cv.CAPDSHOW 설정을 하게 되면 에러가 난다) OpenCV가 DirectShow를 사용하여 카메라를 캡처하도록 지정됩니다. 이것은 일부 특정한 상황에서 필요할 수 있습니다. 예를 들어, 일부 카메라가 DirectShow를 통해 더 잘 작동하거나, 다른 캡처 소스에 액세스할 필요가 없는 경우에 사용될 수 있습니다. 그러나 일반적.. 더보기