예름의 개발 TIL

예름의 개발 TIL

  • 분류 전체보기 (122)
    • Artificial Intelligence (64)
      • 모두를 위한 딥러닝 (PyTorch) (13)
      • Computer Vision (10)
      • CS231n (Stanford) (17)
      • CS236 (Stanford) (19)
      • LG Aimers 7기 (0)
      • MLOps & Reproducible ML (2)
    • Project Log (31)
      • 학부 졸업프로젝트 (31)
    • Mobile Programming (5)
    • AWS (3)
    • Node.js (1)
    • Distributed System (0)
    • Paper (13)
      • Robotics (1)
      • Ubiquitous AI (1)
      • How to read (1)
      • Human-centric Ubiquitous In.. (1)
      • Trustworthy AI (9)
    • Etc (5)
  • 홈
  • 태그
  • 방명록
RSS 피드
로그인
로그아웃 글쓰기 관리

예름의 개발 TIL

컨텐츠 검색

태그

모두를 위한 딥러닝 시즌2 라즈베리파이 aws lambda Learning rate 딥러닝 cost 계산 졸업프로젝트 cs236: deep generative models 파이토치 django 프로젝트 구조 gradient descent docker container aws IoT core firebase Tensor Manipulation pytorch stanford cs236 필기본 stanford cs231n 필기본 docker cs231n: deep learning for computer vision openAI API Key

최근글

댓글

공지사항

아카이브

Paper(13)

  • [논문 리뷰] Noise Matters: Optimizing Matching Noise for Diffusion Classifiers

    WANG, Yanghao; CHEN, Long. Noise Matters: Optimizing Matching Noise for Diffusion Classifiers. arXiv preprint arXiv:2508.11330, 2025. 사전 학습된 판별 비전-언어 모델인 CLIP은 제로샷 이미지 분류 성능이 좋지만, 단어 간의 관계는 이해하지 못하는 Bag of Words 문제와 Spurious bias 문제를 가지고 있습니다.이러한 문제를 해결하기 위해 생성 모델을 활용합니다. Diffusion Classifier (DC)는 랜덤하게 가우시안 노이즈를 샘플링합니다. DC는 노이즈 불안정성 문제를 가집니다. 다르게 랜덤 샘플링된 노이즈는 성능에 상당한 영향을 줍니다. 좋은 노이즈는 불안정성을 완화하..

    2025.09.18
  • [논문 리뷰] Efficient Image-to-Image Diffusion Classifier for Adversarial Robustness

    MEI, Hefei; DONG, Minjing; XU, Chang. Efficient Image-to-Image Diffusion Classifier for Adversarial Robustness. In: Proceedings of the AAAI Conference on Artificial Intelligence. 2025. p. 6081-6089. 디퓨젼 기반 모델은 공격에 대한 방어 능력이 높은 장점을 가졌지만, 연산 비용이 크다는 단점이 있습니다.이로 인해, 강한 공격에 대한 방어 능력을 평가하는 것, 기존 CNN 방법과의 비교가 어려워집니다.더 나은 적대적 공격에 대한 강건성을 보이면서, 연산 비용이 적게 필요한 ‘효율적인’ 이미지-투-이미지 diffusion classifier를 개발하는 것..

    2025.07.24
  • Diffusion model 수식 정리 (간단한 버전)

    어떤 논문의 Preliminary 부분을 읽다가 Diffusion model에서 중요한 수식이 일부 요약된 것을 보았다.그 부분을 보다가 Forward process와 Reverse process가 무엇인지 말로는 아는데, 구체적인 수식과 손실함수 계산 방식에 대해 잘 모르고 있다는 걸 깨달았다. Diffusion model 논문을 혼자 잘 이해하면 좋겠지만, 나는 이것을 잘 이해하고 있는 사람의 설명이 필요하다고 느꼈다.그래서 유튜브 영상을 보며, 핵심 내용을 정리해보았다. 수식 전개에서 생략된 부분이나 원리를 설명해주셔서 이해에 도움이 되었다. 영상을 따라 간단하게 정리했으니, 다음에는 논문을 통해 더 꼼꼼히 봐야겠다. 참고한 유튜브 영상, 디퓨젼 수식을 정리한 사이트, 논문 정보는 다음과 같다.h..

    2025.07.22
  • [논문 리뷰] Artificial Kuramoto Oscillatory Neurons

    MIYATO, Takeru, et al. Artificial Kuramoto Oscillatory Neurons. arXiv preprint arXiv:2410.13821, 2024. Abstract신경과학과 AI 분야에서 뉴런의 '결합'은 경쟁 학습을 촉진하고 더 깊은 레이어에서 추상적인 개념을 형성할 수 있도록 하는 것으로 알려져 있다. Artificial Kuramoto Oscillatory Neurons (AKOrN)은 임계값 기반이 아닌, 동적 시스템으로 동작한다. Fully Connected, Convolutional, Attentive mechanisms를 포함한 기존 설계와 통합될 수 있다. Kuramoto 업데이트를 통해 뉴런들을 동기화하여 하나로 묶는다. AKOrN은 unsupervi..

    2025.07.18
  • [논문 리뷰] Can We Talk Models Into Seeing the World Differently?

    GAVRIKOV, Paul, et al. Can we talk models into seeing the world differently?. In: Thirteenth International Conference on Learning Representations. OpenReview. net, 2025. SCISPACE 질문봇으로 활용하기SCISPACE에서는 업로드한 논문 PDF 파일을 토대로 챗봇과 대화할 수 있다. '논문을 읽는 것은 나 스스로 하고, 챗봇은 나에게 질문을 던지는 용도로 사용해보면 어떨까?' 라는 생각을 했다. 나는 A에 집중해서 읽고 발표를 했는데, 청중은 B를 핵심으로 파악하고 질문을 던질 수도 있다. 혼자 읽다보면 핵심이 무엇인지 놓칠 수도 있다는 뜻이다. 또는 내가 어렵다고 느..

    2025.07.17
  • [논문 리뷰] Compositional Scene Understanding through Inverse Generative Modeling

    WANG, Yanbo; DAUWELS, Justin; DU, Yilun. Compositional Scene Understanding through Inverse Generative Modeling. arXiv preprint arXiv:2505.21780, 2025. AbstractGenerative model은 시각적 콘텐츠를 생성하는 것 뿐만 아니라, 자연스러운 이미지를 통해 장면의 속성을 이해하는 데에도 활용될 수 있다. 본 논문에서는 훈련 중에 본 적 없는 이미지들에서도 장면 구조를 잘 추론할 수 있도록, 더 작은 모델들로부터 compositional하게 visual generative model을 구축하는 방법을 제안한다. 이 방식은 장면 내 객체 집합과 global scene factors..

    2025.07.10
  • [논문 리뷰] Classification-Denoising Networks

    THIRY, Louis; GUTH, Florentin. Classification-Denoising Networks. arXiv preprint arXiv:2410.03505, 2024. Abstract이미지 분류와 디노이징은 Robustness 부족과 조건 정보 무시 문제를 갖는다. 이러한 문제는 이미지의 joint probability와 클래스 레이블을 하나로 통합하여 완화할 수 있다. 분류는 forward pass로 수행된다. Tweedie-Miyasawa formula를 사용하여, score로 denoising function을 평가한다. Training objective는 cross-entropy loss와 denoising score matching loss의 조합으로 이루어진다. CIFAR..

    2025.07.10
  • [논문 리뷰] Diffusion Classifiers Understand Compositionality, but Conditions Apply

    이번 주 목표'Intriguing properties of generative classifiers' 논문 이후, 이를 인용한 논문 5개를 정리하려고 한다. 목표는 1) 이전에 읽었던 논문과의 연관성을 파악하는 것, 2) 수식에 있는 각 항의 의미를 단편적으로 보지 말고 전체적인 의미를 명확하게 아는 것, 3) 피피티에 핵심 줄기를 담는 것이다. (일주일만에 터득하기에 어렵겠지만, 그래도 시도는 해볼 수 있으니까!) 이번 주에 5개의 논문을 읽고, 시간 여유가 된다면 다른 논문들도 가볍게 내용을 파악해서 그룹핑하는 것까지 하면 좋을 것 같다. JEONG, Yujin, et al. Diffusion Classifiers Understand Compositionality, but Conditions Appl..

    2025.07.08
  • [논문 리뷰] Intriguing properties of generative classifiers

    아래 논문을 읽고 중요한 내용 위주로 정리해 보았다. JAINI, Priyank; CLARK, Kevin; GEIRHOS, Robert. Intriguing properties of generative classifiers. arXiv preprint arXiv:2309.16779, 2023. Discriminative classifiers와 Generative text-to-image models를 통합한 Generative classifiers가 얼마나 사람의 시각과 비슷한 속성을 보이는지 다양한 실험을 통해 검증하였다. Generative model을 classifier로 활용할 가능성을 보여주는 논문이었다. 이 논문을 읽은 후에 실험에서 우수한 성능을 보인 Imagen 논문을 먼저 찾아 읽었다...

    2025.07.04
이전
1 2
다음
티스토리
© 2018 TISTORY. All rights reserved.

티스토리툴바