본문 바로가기

딥러닝(Deep Learning)/딥러닝 기타 지식

백본 모델(back-born Model) 정리(Feat. CNN기반,자연어 처리, 트랜스포머(Transformer) etc) * 컴퓨터 비전과 딥러닝 P524 中....자연어 처리 백본 모델: BERT, GPT라는 자연어 처리(NLP) 백본 모델이 있다. -> 이를 이용하여 [언어 번역],[챗봇],[질의응답],[문서 요약] 등을 포함해 수십 가지 응용 문제에 성공적으로 전이 학습하다. 비전 트랜스포머 백본 모델 : SWIN Transformer (SWIN Transformer는 분류, 검출, 추적 등에 두루 사용할 수 있는 백본 비전 트랜스포머를 만들기 위해 애초에 설계됨)* 부연 설명 : BERT, GPT 와 같은 [자연어 처리] 백본 모델과 달리 [비전]용 Transformer는 영상의 특성을 고려하여 설계해야 한다. 영상의 특성 : 영상을 구성하는 물체는 물체끼리 겹치거나 섞이고, 물체와 배경이 심하게 겹치거나 섞여 있는.. 더보기
정밀도(Precision), 재현율(Recall) 정밀도(Precision) : [모델이 positive로 예측한 샘플 중]에서 실제로 positive인 샘플의 비율. -> 높은 정밀도는 false positive의 수가 적음을 의미하며, [모델]이 잘못된 예측을 하는 경우가 적다는 것을 나타냅니다. 재현율(Recall) : [실제 positive인 샘플 중]에서 모델이 올바르게 positive로 예측한 샘플의 비율. -> 높은 재현율은 false negative의 수가 적음을 의미하며, 모델이 실제 positive 샘플을 더 많이 식별한다는 것을 의미합니다. * 둘 다 [모델]이 Positive 클래스를 얼마나 잘 예측하는 지를 측정하는 기법이다. 다만 [분모]가 다를 뿐!!!! 더보기
Hyper Paramater Tuning(Feat. 모델 최적화) Parameter(매개변수) vs Hyper Parameter(하이퍼 매개변수) Parameter (파라미터, 매개변수) Parameter는 모델 내부에서 결정되는 변수, 데이터를 통해서 산출이 가능한 값이며 학습 시 얻어지는 값이다. 모델 내부에서 데이터를 통해 구해진다. 예측을 수행할 때, 모델에 의해 요구되어지는 값 측정되거나 데이터로부터 학습되어진다. 학습된 모델의 일부로 저장되어진다. ex. 인공신경망에서의 가중치 계수(weight coefficient), SVM(서포트 벡터 머신)에서의 서포트 벡터, 선형회귀나 로지스틱회귀분석에서의 결정계수, 편향(bias) Hyperparameter (하이퍼파라미터, 초매개변수) Hyperparameter는 주로 알고리즘 사용자가 경험에 의해 직접 세팅하는 .. 더보기