본문 바로가기
728x90

분류 전체보기429

Digital Image Processing - Smoothing / Edging Noise Signal에서 변화를 감지하려면 미분을 해서 찾아내야 하는데 미분은 noise에 굉장히 취약하다. 미분을 하면 기울기가 나오는데 아무리 작은 noise라도 위아래로 피크가 생기면 그 기울기값은 매우 커지기 때문이다. 따라서 미분을 하기 전에 gaussian filter를 통과시켜서 noise를 제거한다. gaussian filtering으로 denoise를 해주고 미분을 하니 원하는대로 signal이 변하는 부분을 쉽게 캐치할 수 있는 것을 볼 수 있다. 이때 convolution 미분 연산을 아래와 같이 바꿀 수 있는 성질이 있는데 이를 이용하면 DoG(Derivative of Gaussian)을 만들어서 사용할 수 있다. x방향이느냐 y방향이느냐에 따라 DoG는 아래와 같이 나타난다. S.. 2024. 4. 5.
Algorithm Design - Tree Tree 우선 트리구조를 가볍게 살펴보자. 이미 자료구조론 수업에서 다뤘던 내용이기 때문에 간단하게만 살펴보려한다. Tree terminology 1. 루트(Root): 부모가 없는 노드 (A) 2. 자식(Child): 노드 u가 노드 v의 부모라면, v는 u의 자식입니다. 3. Siblings: 같은 부모를 가진 노드들 4. Internal node: 적어도 하나의 자식을 가진 노드 (A, B, C, F) 5. Leaf node: 자식이 없는 노드 (E, I, J, K, G, H, D) 6. 노드의 깊이(Depth of a node): ancestor의 수 7. Height of a tree: 어떤 노드의 최대 깊이 8. 차수(Degree): 노드의 자식 수 Traversal 종류 Preorder (.. 2024. 4. 4.
[논문 리뷰] YOLO-World: Real-Time Open-Vocabulary Object Detection 리뷰 Intro 우선 YOLO는 You Only Look Once의 약자이다. YOLO이전의 R-CNN은 이미지 안에서 bounding box를 생성하기 위해 sliding window를 사용하여 region proposal 방식으로 사진의 부분부분을 확인한다. bounding box에 classifier를 적용하여 분류한 뒤 bounding box를 조정하고, 중복된 검출을 제거하고, 객체에 따라 box의 점수를 재산정하기 위해 후처리를 한다. 반면 YOLO는 이미지 전체를 한눈에 보고 regression으로 multi task를 한번에 처리한다. 이렇게 간단히만 알아봐도 처리속도가 훨씬 빠르고 실시간 처리에 적합할 것이 쉽게 파악된다. Background Object Detection에는 두 가지 방식이 .. 2024. 4. 4.
DIP 실습 - SpreadSalt Noise / Gradation / Editing Spread Color Salt 주어진 영상(img1.jpg)에 빨강, 파랑, 초록 색의 점을 각각 설정한 개수만큼 무작위로 생성하는 프로그램을 작성하고 생성한 영상에서 빨강,파랑, 초록색의 점을 각각 카운트하는 프로그램을 작성하고 카운트 결과가 실제와 일치하는지 검증하라. 처음에는 SpreadSalt함수를 그대로 변형하여 SpreadRed, SpreadBlue, SpreadGreen함수를 만들어서 이미 색이 있는 점을 찍은 곳에 또다시 점을 찍어서 count를 했을때 원하는 숫자만큼 세지지 않는 문제가 있었다. 이를 해결하기 위해 조건문 하나를 더 넣어줘서 빨간점, 파란점, 초록점이 이미 있는 곳에는 다시 찍지 않고 그냥 넘어가되 for문을 돌리는 횟수의 기준이 되는 n을 1감소 시켜서 찍지 않은 횟수.. 2024. 4. 3.
알고리즘 설계 실습 - 트리 순환 문제 위의 문제처럼 트리를 만들고 preorder, inorder, postoder함수를 짜서 실행시켜보면되는 단순한 문제이다. 이전에 자료구조론 수업을 들을 때 C++로 몇날 몇일을 고생하면서 B트리를 설계했던 기억이 있는데 비교적 간단한 트리 순환 문제였다. import sys input = sys.stdin.readline # 입력 받기 N = int(input()) # 빈 트리 정의 tree = {} for n in range(N): root, left, right = sys.stdin.readline().strip().split() tree[root] = [left, right] # preorder def preorder(root): if root != '.': print(root, end=''.. 2024. 4. 3.
Digital Image Processing - Denoising / Filter / Edge Detection Denoise 노이즈를 제거하는 과정을 denoise라고 하는데 우선 noise에 대서 알아보자. 다양한 노이즈의 종류가 있지만 대표적인 노이즈들을 한번 살펴보자. Salt-and-pepper noise: 흑백 픽셀의 무작위 발생이다. Impuse noise: 백색 픽셀의 무작위 발생이다. Gaussian noise: 가우시안 정규분포를 따르는 노이즈로 자연발생한 노이즈들이 자연적인 분포를 따르며 발생하는 노이즈이다. Gaussian noise를 Gaussian filter로 denoising하면 아래와 같이 standard한 denoising과정이 진행된다. 그러나 아래와 같은 Salt-and-pepper noise를 gaussian filter로 denoise를 하려하면 잘 진행이 되지 않는다. 다양.. 2024. 4. 3.
[논문 리뷰]Asymmetric Student-Teacher Networks for Industrial Anomaly Detection(2) Problem 이제 본격적으로 방법론과 모델의 구조에 대해서 살펴볼텐데 그에 앞서서 이러한 새로운 방법론이 나온 이유를 살펴보자. 기존의 Image anomaly detection 방법론들은 크게 아래의 세가지 문제점이 있었다. 1. Teacher-Student 대칭적 구조로 인한 Undesired Generalization 2. OOD input not OOD output 3. Perfect density models cannot guarantee anomaly detection. 하나씩 살펴보자. Teacher-Student 대칭적 구조로 인한 Undesired Generalization Teacher-Student 구조의 Anomaly Detection은 Teacher와 Student 의 outpu.. 2024. 4. 1.
Softmax classifier Intro 인공지능 응용 수업을 수강하고 있는데 사실 인공지능 기초는 다양한 공개 강의들을 통해서 공부했고 몇몇 프로젝트도 진행했기에 아주 가법게 생각하고 듣기 시작했다. 그러나 생각보다 기초적인 부분에서 수식 증명과 같은 세부사항들에서 잊은 내용들이 있어서 기초를 다시 돌아보기 좋다는 생각이들어 블로그 정리도 간간히 하려고 한다. Express as Probability 추론의 결과를 0부터 1까지의 확률로 표현하기 위해서 sigmoid함수가 사용될 수 있다. Sigmoid함수를 미분하면 위와 같이 계산된다. 이를 간단하게 표현하면 P'=P(1-P)가 된다. Sigmoid함수를 이용하여 미분된 sigmoid 함수를 표현할 수 있는 것이다. 또한 P가 0 또는 1의 극단으로 갈 수록 미분의 결과는 0에 .. 2024. 3. 31.
[논문 리뷰]Asymmetric Student-Teacher Networks for Industrial Anomaly Detection(1) Intro 다른 Knowledge distillation 기반의 Anomaly Detection과 마찬가지로 Teacher-Student 구조로 Anomaly Detection를 수행한다. Student의 undesired Generalization 문제를 해결하기 위해 Teacher-Student 간 비대칭 구조 제안한다. OOD input에 대해 민감하게 반응할 수 있도록 Teacher 모델로 Normalizing flow를 사용한다. 2D RGB 데이터 뿐만 아니라 3D data까지 Anomaly Detection을 확장할 수 있다. Background Image Anomaly Detection은 Input 이미지 내 이상치 포함 여부를 판단하는 Task로 크게 Image-level, Pixel-l.. 2024. 3. 31.
728x90