분류 전체보기 17

5장 : 머신러닝의 기본 요소

5.1 일반화 : 머신러닝의 목표 # 과대적합과 과소적합 1) 훈련데이터의 손실이 낮아질수로 테스트 데이터의 손실도 낮아짐. 이러한 상황이 발생할 때 모델이 과소적합 (underfitting)되었다고함 -> 즉, 네트워크가 훈련 데이터에있는 모든 관련 패턴을 학습하지 못함! 2) 테스트 데이터의 손실의 증감이 바뀌는 critical point 에서 최적 적합이 일어남 3) 테스트 데이터의 손실이 증가,,,,,-> 훈련데이터에 특화된 패턴을 학습하기 시작 -> " 과대 적합" ***과대적합이 일어나는 경우는 데이터에 잡음이 있거나, 불확실성이 존재하거나, 드문 특성이 포함되어 있을 때 발생할 가능성이 높음! **불확실한 특성 : 문제에 불확실성과 모호성이 있을 때 존재 : ex) 바나나가 덜 익었는지, 익..

3장. 신경망 시작하기

학습은 크게 지도학습, 비지도 학습 +a 등등으로 나누어지고 이중에 지도학습은 크게 분류와 회귀로 나뉜다. *********** 회귀와 분류의 차이!!!!!!!!!!!!!!!! 회귀는 예측하고자 하는 타겟값이 실수, 즉 숫자인 경우이다. 그리고 회귀는 예측 결과가 연속성을 지닌다. 분류는 예측하고자 하는 타겟값이 범주형 변수인 경우이다. 회귀와 다르게 분류는 예측 결과가 연속성을 지니지 않는다. 분류모델은 크게 이진 분류(Binary Classification)와 다중 분류(Multi Classification)으로 나누님. - 이진분류 : 입력값에 따라 모델이 분류한 카테고리가 두가지인 분류 알고리즘 주로 어떤 대상에 대한 규칙이 참(True)인지 거짓인지를 분류하는 데 쓰임 -> True / Fals..

카테고리 없음 2022.12.08

AlexNet 논문

Abstract - 네트워크 구성 :( five convolution layer + max-pooling layers ) + (three fully-connected layers + final 1000-way softmax) - training을 빠르게 하기 위해서 non-saturating neurons와 매우 efficient한 GPU를 사용했다. *** non saturating neurons????-> activation function에서 일어나는 saturation 현상을 말하는 것인가? *** saturation 현상 : weight의 update가 멈추는 현상 ( 추가 공부하기 : https://nittaku.tistory.com/267) - fully connected layer에서의 o..

DL/논문 스터디 2022.11.29

2장. 신경망의 수학적 구성 요소

2.1 신경망과의 첫 만남 # 클래스와 레이블 클래스(class) : 분류 문제의 범주(category) 샘플(sample) : 데이터 포인트 레이블(label): 특정 샘플의 클래스 *** # MNIST 데이터셋 -> 넘파이 배열 형태(숫자 배열)로 인코딩되어 있고 케라스에 이미 포함 2.2 신경망을 위한 데이터 표현 # 텐서 -> 데이터를 위한 컨테이너(container) , 수치형 데이터를 위한 컨테이너 1) 스칼라( 랭크-0 텐서) - 하나의 숫자만 담고 있는 텐서 - 타입 : float32, float64 - .ndim(넘파이 배열의 축 개수) = 0 ** 텐서의 축 개수를 랭크(rank)라고도 부름 2) 벡터 ( 랭크-1 텐서) - 숫자의 배열은 담고 있는 텐서 - 랭크-1 텐서 / 1D 텐서..

1장. 딥러닝이란 무엇인가?

1.1 인공지능과 머신 러닝, 딥러닝 1.1.1 인공지능 = 보통의 사람이 수행하는 지능적인 작업을 자동화 하기 위한 연구 활동 1.1.2 머신 러닝 # 전통적인 프로그래밍 vs 머신러닝 전통적인 프로그래밍은 규칙과 데이터로 해답을 얻을 수 있고 머신러닝 시스템은 데이터 와 해답을 가지고 규칙을 생성함 -> 생성하는 과정 = 훈련(training) # 머신러닝을 위한 필요 조건 1) 입력 데이터 포인트 2) 기대 출력 3) 알고리즘의 현재 출력과 기대출력 간의 차이를 결정하기 위해 필요 -> 머신러닝 모델은 입력데이터를 의미 있는 출력으로 변환 = 알고있는 입력과 출력의 샘플로부터 학습하는 과정 # 데이터 변환 머신러닝과 딥러닝의 핵심 문제는 의미있는 데이터로의 변환이다. ex) 컬러 이미지의 경우 데이..