Artificial Intelligence/Computer Vision(10)
-
Neural Network: Perceptron & MLP
Neural NetworkNeural Network에 속하는 Perceptron은 linear 하고, MLP는 non-linear 함.이후 MLP보다 성능이 좋은 SVM이 많이 활용됨.Deep Neural Network(DNN)가 등장하면서 SVM이 덜 사용되고 있으며, 양질의 빅데이터를 모으기 어려운 경우에는 SVM을 활용함.Perceptron with Activation functionLearning Procedure0 부터 1 사이의 값으로 랜덤하게 가중치를 부여하기Training data로부터 inputs 나타내기Output hw를 얻고, 가중치를 조금씩 조절하여 원하는 출력 T에 가까운 결과를 얻기가중치 값이 수렴하도록 epochs를 설정하여 반복하기Perceptron with Activatio..
2024.06.17 -
Logistic Regression
Logistic Regression ModelHypothesis model이 0과 1 사이의 값을 출력하도록 만듬.Decision BoundaryLinear Decision Boundary & Non-linear Decision BoundaryLogistic Regression Cost functionGradient DescentMulticlass ClassificationLogistic regression classifier를 train할 때, 각각의 클래스에 대해 가설을 생성함.예측을 위해, 가설 값을 최대화하는 클래스 i를 선택함. * 참고 자료컴퓨터비전 강의자료(김은이 교수님)
2024.06.16 -
Linear Regression
Linear regression with one variableModel representationm = 훈련 데이터 개수, x = input 변수 (features), y = output 변수 (target 변수) Cost function비용 함수 J를 최소화 해야 함.Gradient DescentLearning rate α가 너무 작으면, gradient descent는 느릴 수 있음.Learning rate α가 너무 크면, gradient descent는 최소값을 overshoot하여 수렴에 실패할 수 있음. Learning rate α 값만 수정해도, local minimum에 수렴하도록 할 수 있음. Linear regression with multiple variableModel repres..
2024.06.16 -
Orientation
Orientation객체의 Orientation을 연장선의 orientation(최소 2차 모멘트의 축)으로 정의함.수식에서 r은 [i, j]로부터의 수직 거리임. Polar representation of a straight line Axis with Least Second Moment * 참고 자료컴퓨터비전 강의자료(김은이 교수님)
2024.06.16 -
Image Matching System using Early Vision
K-fold cross validation (교차 검증)k개의 fold로 나누고, fold별 accuracy를 구함. 이를 이용해서 Average accuracy를 구함.아래의 5-fold cross validation의 경우, Train data : Validation data = 8 : 2 비율임.Confusion matrixThe curse of dimensionalityFeature를 너무 많이 사용하면 차원이 커지고 모델 복잡도가 높아지므로, 일반화 성능이 감소함.K-means for dimension reduction을 이용해서 n-dim features를 k-dim features로 줄일 수 있음.SimilarityManhattan distance, Euclidean distance, Mah..
2024.06.16 -
Mid level features: Shapes
ShapesShape은 Color, Texture보다 고차원적인 피처임.Color, Texture는 이미지 전체에 나타나는 속성이지만, Shape은 specific region에만 나타나기 때문임.Segmentation 문제 해결에서 shape description을 위한 interests operator가 사용됨. Shape descriptorShape은 Region descriptors, Boundary, Interest points (corners)로 정의함.Region based shape descriptors모양의 기하학적 속성크기, 무게중심, 둘레, 둘레의 길이, 원형성, 연장선, 반경의 평균 및 표준편차, 2차 모멘트(행, 열, mixed), 바운딩 박스, 바운딩 박스로부터 좌표 상의 거리,..
2024.06.04 -
Mid level features: Textures
TextureTexture는 반복되는 패턴을 보임.Color histogram과는 달리, Color와 Intensity의 공간적 분포를 고려한 피처.Structural approaches관점: Texture는 정규적이고 반복되는 관계를 가진 primitive texels의 집합임.지표: 크기, 입자성, 방향성, 랜덤한 정도Statistical approaches관점: Texture는 Intensity 배열의 양적인 값이며, 이를 feature vector 라고 함.Texture segmentation은 Texture 간의 경계를 결정하는 것.Texture classification은 특성에 따라 Texture 클래스를 식별하는 것.Simple featuresRange: 인접한 Intensity의 최댓값과..
2024.05.29 -
Region Segmentation
Image segmentation이미지 분할은 연결된 픽셀 집합(Region)으로 이미지를 나누는 것.noise가 많은 이미지에 적합함.Oversegmented 또는 Undersegmented 되지 않도록 주의해야 함.Region-based segmentation 종류 과거현재Region growing, Split and MergeClustering Region growing임의의 픽셀 1개를 선택하고, 인접한 픽셀들을 병합하는 방식으로 grow 함. Split and Merge비슷하지 않은 4개의 region으로 split 함.유사한 region끼리만 merge 함.ClusteringClustering 피처를 기준으로 객체들을 그룹화하는 것.Centroid model데이터를 식별하기 전에 클러스터 개수..
2024.05.29 -
Basic image features: Color & Edge
Color coding methodRGB 컬러 큐브RGB 값이 정규화 됨. Normalized RGBIntensityI = (R+G+B) / 3Normalized redr = R/(R+G+B)Normalized greeng = G/(R+G+B)Normalized blueb = B/(R+G+B) Color hexagon for HSI (HSV)Hue각 [0,2π]Saturation수직축으로부터 거리 [0,1]Intensity수직축에서의 높이 [0,1] Color TransformRGB → HSI HSI → RGBIntensity = 0 이면, Saturation은 정의되지 않음.Saturation = 0 이면, Hue는 정의되지 않음. RGB → YIQColor Histogram이미지의 피처를 나타내며..
2024.05.29