예름의 개발 TIL

예름의 개발 TIL

  • 분류 전체보기 (111)
    • Artificial Intelligence (62)
      • 모두를 위한 딥러닝 (PyTorch) (13)
      • Computer Vision (10)
      • CS231n (Stanford) (17)
      • CS236 (Stanford) (19)
    • Project Log (31)
      • 학부 졸업프로젝트 (31)
    • Mobile Programming (5)
    • AWS (3)
    • Node.js (1)
    • Distributed System (0)
    • Paper (4)
      • Robotics (1)
      • Ubiquitous AI (1)
      • How to read (1)
      • Human-centric Ubiquitous In.. (1)
      • Trustworthy AI (0)
    • Etc (5)
  • 홈
  • 태그
  • 방명록
RSS 피드
로그인
로그아웃 글쓰기 관리

예름의 개발 TIL

컨텐츠 검색

태그

aws IoT core docker container django 프로젝트 구조 gradient descent 딥러닝 cost 계산 openAI API Key 졸업프로젝트 stanford cs231n 필기본 파이토치 cs236: deep generative models docker Tensor Manipulation aws lambda 라즈베리파이 cs231n: deep learning for computer vision stanford cs236 필기본 pytorch Learning rate 모두를 위한 딥러닝 시즌2 firebase

최근글

댓글

공지사항

아카이브

Overfitting(1)

  • [PyTorch] Train/Validation/Test & Overfitting 실습 : 모두를 위한 딥러닝 시즌2

    Train/Validation/Test & Overfitting 이론 요약 압정을 던졌을 때 위로 떨어지는 경우를 클래스 1, 아래로 떨어지는 경우를 클래스 2로 설정한다. 총시행 횟수와 클래스 1이 나온 횟수, 1번 시행 시 일어날 확률을 사용하여 이항 분포로 모델링할 수 있다. Gradient Ascent를 통해 데이터를 가장 잘 설명하는 세타를 찾는 과정은 Likelihood를 최대화하여 Local Maxima를 찾는 과정이다.  데이터를 Training set, Validation set, Test set을 일정 비율로 나누어 모델을 훈련하고 평가할 수 있다. 훈련 데이터를 과도하게 학습하는 Overfitting이 일어나면, 새로운 검증 데이터에 대해 일반화 성능이 떨어져서 Train Loss는 ..

    2024.09.08
이전
1
다음
티스토리
© 2018 TISTORY. All rights reserved.

티스토리툴바