Deep Learning

momentum update

응엉잉 2022. 8. 30. 11:05

https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=lego7407&logNo=221681014509 

SGD + 관성을 더해준 방식

parameter 값을 조정할 때 전체 data가 아닌 랜덤으로 선택한 1개의 data에 대해서만 계산하는 방법인 SGD

최솟값까지 지그재그로 이동해서 비효율적 -> momentum 이용해 보충 (관성을 더해줌)

SGD에서 계산된 접선의 기울기에 한 step 전의 접선의 기울기값을 일정 비율만큼 반영

local minimum에서 탈출하는 효과를 얻을 수 있음

 

 

'Deep Learning' 카테고리의 다른 글

loss back-propagating  (0) 2022.08.30
Dive into BYOL  (0) 2022.08.25
cv2  (0) 2022.08.19
lambda(), sort()에서 key와 lambda 사용하기  (0) 2022.08.18
os와 glob  (0) 2022.08.18