https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=lego7407&logNo=221681014509 SGD + 관성을 더해준 방식 parameter 값을 조정할 때 전체 data가 아닌 랜덤으로 선택한 1개의 data에 대해서만 계산하는 방법인 SGD 최솟값까지 지그재그로 이동해서 비효율적 -> momentum 이용해 보충 (관성을 더해줌) SGD에서 계산된 접선의 기울기에 한 step 전의 접선의 기울기값을 일정 비율만큼 반영 local minimum에서 탈출하는 효과를 얻을 수 있음