♥ 최신 글
-
[논문 리뷰] Papers of Generative Models
Overviewcs236에 나왔던 생성형 모델 중 일부를 다룬다. Autoregressive model, Normalizing flows, Score-based models, Diffusion models에 대한 논문을 읽고, 모델의 핵심이 되는 특징을 중심으로 정리했다. 자기 회귀 모델의 일종인 'Neural Auto Regressive distribution Estimator (NADE)'입니다. 1. 고차원 이산 변수의 분포를 모델링하는 모델입니다.2. Restricted Boltzmann Machine에서 영감을 받았습니다. 기존 RBM의 한계점은 partition function의 계산이 불가능에 가깝다는 것입니다.3. 이 논문에서 제안하는 NADE는 결합 확률을 계산할 수 있는 조건부 확률의 ..
-
[논문 리뷰] Noise Matters: Optimizing Matching Noise for Diffusion Classifiers
WANG, Yanghao; CHEN, Long. Noise Matters: Optimizing Matching Noise for Diffusion Classifiers. arXiv preprint arXiv:2508.11330, 2025. 사전 학습된 판별 비전-언어 모델인 CLIP은 제로샷 이미지 분류 성능이 좋지만, 단어 간의 관계는 이해하지 못하는 Bag of Words 문제와 Spurious bias 문제를 가지고 있습니다.이러한 문제를 해결하기 위해 생성 모델을 활용합니다. Diffusion Classifier (DC)는 랜덤하게 가우시안 노이즈를 샘플링합니다. DC는 노이즈 불안정성 문제를 가집니다. 다르게 랜덤 샘플링된 노이즈는 성능에 상당한 영향을 줍니다. 좋은 노이즈는 불안정성을 완화하..
-
[ML 템플릿] Yet Another Lightning Hydra Template 분석
ML 프로젝트 템플릿?논문과 함께 제출된 코드를 보면 자유롭게 디렉토리를 구성한 경우도 있고, 템플릿에 맞춰 구성한 듯한 경우도 있었다. 과도한 프레임워크나 템플릿 사용을 경계해야 한다고 생각하는데, 일정한 구조로 구성된 프로젝트가 많다는 것은 사람들의 편의성을 높이는 무언가가 있다는 뜻이었다. 머신러닝 프로젝트에서 효율적인 워크플로우와 재현성 향상에 도움을 주는 'Yet Another Lightning Hydra Template'에 대해 알아보겠다. 이 템플릿은 새로운 모델을 빠르게 반복하고 다양한 접근 방식을 비교하며, 결과에 대한 신뢰성과 투명성을 높이고 시간과 자원을 절약할 수 있다. PyTorch Lightning과 Hydra가 기반을 이루고 있으며, 고수준의 모듈화와 확장 가능한 구조를 가..
-
[MLFlow Tutorial] MLOps 도구: MLFlow 사용 방법 (Karndeep Singh)
학습 목적ML 논문의 실험 재현에 대해 탐색하던 중, MLOps가 재현성을 개선할 수 있다는 내용을 보았다. 실험 및 배포 이상의 기능을 가지고 있어 내가 시도하려는 '재현' 자체보다는 멀리 가는 것 같기도 하다. 하지만 알아두면 좋을 툴인거 같아서, 튜토리얼 영상을 간단히 정리해보기로 했다.MLOps는 머신 러닝 엔지니어링의 핵심 기능으로, ML 모델을 프로덕션 환경에 배포한 후 모니터링 및 유지 관리하는 프로세스를 간소화하는 데 중점을 둔다. 학습 콘텐츠MLOps 도구 중 하나인 MLFlow에 대한 강의이다. 총 5강으로 짧게 구성되어 있다. 다양한 튜토리얼 영상들 중 이것을 고른 이유는 마지막 강의의 GCP에서 MLFlow 서버를 셋업하는 내용이 궁금했기 때문이다.https://youtu.be/v1..
-
[논문 리뷰] Efficient Image-to-Image Diffusion Classifier for Adversarial Robustness
MEI, Hefei; DONG, Minjing; XU, Chang. Efficient Image-to-Image Diffusion Classifier for Adversarial Robustness. In: Proceedings of the AAAI Conference on Artificial Intelligence. 2025. p. 6081-6089. 디퓨젼 기반 모델은 공격에 대한 방어 능력이 높은 장점을 가졌지만, 연산 비용이 크다는 단점이 있습니다.이로 인해, 강한 공격에 대한 방어 능력을 평가하는 것, 기존 CNN 방법과의 비교가 어려워집니다.더 나은 적대적 공격에 대한 강건성을 보이면서, 연산 비용이 적게 필요한 ‘효율적인’ 이미지-투-이미지 diffusion classifier를 개발하는 것..
-
Diffusion model 수식 정리 (간단한 버전)
어떤 논문의 Preliminary 부분을 읽다가 Diffusion model에서 중요한 수식이 일부 요약된 것을 보았다.그 부분을 보다가 Forward process와 Reverse process가 무엇인지 말로는 아는데, 구체적인 수식과 손실함수 계산 방식에 대해 잘 모르고 있다는 걸 깨달았다. Diffusion model 논문을 혼자 잘 이해하면 좋겠지만, 나는 이것을 잘 이해하고 있는 사람의 설명이 필요하다고 느꼈다.그래서 유튜브 영상을 보며, 핵심 내용을 정리해보았다. 수식 전개에서 생략된 부분이나 원리를 설명해주셔서 이해에 도움이 되었다. 영상을 따라 간단하게 정리했으니, 다음에는 논문을 통해 더 꼼꼼히 봐야겠다. 참고한 유튜브 영상, 디퓨젼 수식을 정리한 사이트, 논문 정보는 다음과 같다.h..
-
[논문 리뷰] Artificial Kuramoto Oscillatory Neurons
MIYATO, Takeru, et al. Artificial Kuramoto Oscillatory Neurons. arXiv preprint arXiv:2410.13821, 2024. Abstract신경과학과 AI 분야에서 뉴런의 '결합'은 경쟁 학습을 촉진하고 더 깊은 레이어에서 추상적인 개념을 형성할 수 있도록 하는 것으로 알려져 있다. Artificial Kuramoto Oscillatory Neurons (AKOrN)은 임계값 기반이 아닌, 동적 시스템으로 동작한다. Fully Connected, Convolutional, Attentive mechanisms를 포함한 기존 설계와 통합될 수 있다. Kuramoto 업데이트를 통해 뉴런들을 동기화하여 하나로 묶는다. AKOrN은 unsupervi..
-
[논문 리뷰] Can We Talk Models Into Seeing the World Differently?
GAVRIKOV, Paul, et al. Can we talk models into seeing the world differently?. In: Thirteenth International Conference on Learning Representations. OpenReview. net, 2025. SCISPACE 질문봇으로 활용하기SCISPACE에서는 업로드한 논문 PDF 파일을 토대로 챗봇과 대화할 수 있다. '논문을 읽는 것은 나 스스로 하고, 챗봇은 나에게 질문을 던지는 용도로 사용해보면 어떨까?' 라는 생각을 했다. 나는 A에 집중해서 읽고 발표를 했는데, 청중은 B를 핵심으로 파악하고 질문을 던질 수도 있다. 혼자 읽다보면 핵심이 무엇인지 놓칠 수도 있다는 뜻이다. 또는 내가 어렵다고 느..
♥ 인기 글
-
[CS236] Lecture2 필기본
Lecture 2. BackgroundCS236: Deep Generative Models (Stanford University) 강의를 바탕으로 정리한 자료입니다.
2025.05.09 14:37 -
[PyTorch] MNIST Introduction 실습 : 모두를 위한 딥러닝 시즌2
MNIST Introduction 이론 요약 MNIST 데이터셋은 0~9의 숫자를 손으로 작성한 이미지이다. 우체국에서 편지 우편번호를 자동으로 인식하는 기술을 개발하면서 사용되었다. 훈련 데이터를 활용하여 모델을 학습시키고, 테스트 이미지에 어떤 숫자가 있는지 예측할 수 있다.MNIST 데이터셋, Torchvision 패키지 관련 사이트 MNIST 데이터셋은 lecun 사이트에서 다운받을 수 있다. Forbidden 에러가 나온다면, Kaggle에서 다운로드해서 사용하거나 구글 코랩에서 실행하는 방법이 있다.http://yann.lecun.com/exdb/mnist/Torchvision 패키지는 컴퓨터 비전 분야에서 널리 사용되는 데이터셋, 모델, 이미지 전처리 도구를 제공한다.https://pytor..
2024.09.08 16:02 -
[CS236] Lecture6 필기본
Lecture 6. VAEs(Variational Autoencoders) - (2)CS236: Deep Generative Models (Stanford University) 강의를 바탕으로 정리한 자료입니다.
2025.05.18 02:38 -
[CS236] Lecture5 필기본
Lecture 5. Variational Autoencoders (VAEs)CS236: Deep Generative Models (Stanford University) 강의를 바탕으로 정리한 자료입니다.
2025.05.16 17:01 -
Firebase Realtime database 생성과 연동 방법
회고지난 포스팅에서 Firebase와 Android 앱을 연동하는 방법을 정리하였다. 이번에는 Firebase의 Realtime database 생성 방법에 대해 정리할 것이다. Realtime Database는 무엇일까 Firebase Realtime Database는 클라우드 호스팅 데이터베이스이다. 데이터는 JSON으로 저장되며, 연결된 모든 클라이언트에 실시간으로 동기화된다. 크로스 플랫폼 앱을 개발할 때, 모든 클라이언트가 하나의 실시간 데이터베이스 인스턴스를 공유하고, 자동 업데이트로 최신 데이터를 수신한다. Realtime Database는 NoSQL 데이터베이스로서 최적화 방식과 기능성이 RDBMS와 다르다. Realtime Database API는 작업 실행 속도를 위주로 설계되었다. R..
2024.05.21 01:56