본문 바로가기

Computer Vision

(4)
컴퓨터 비전 영상처리 - 이진 모폴로지, 명암 모폴로지 (팽창, 침식, 열기, 닫기) 영상처리에서 모폴로지란 ? 영상의 형태와 구조를 분석하고 처리하는 기술로서, 영상 내의 객체나 특정한 패턴을 찾고 수정하는 데 사용된다. 주로 이진화된 영상에서 객체의 형태, 크기, 경계 등을 분석하거나 영상의 노이즈를 제거하는 데에 많이 활용된다. 모폴로지 구조적 요소라고 불리는 작은 마스크를 사용하여 수행된다. 원래 생물학에서 생물의 모양 변화를 표현하는 기법이였다. 수학적 모폴로지는 컴퓨터 비전에서 패턴을 원하는 형태로 변환하는 기법이다. 이진 모폴로지와 명암 모폴로지가 있다. 이진 모폴로지 이진 모폴로지 연산에는 4가지가 있다. 팽창, 침식, 열기, 닫기 가 있다. 이진 모폴로지에서의 팽창, 침식, 열기, 닫기 연산 팽창은 객체의 크기가 감소하며 배경은 확대된다. 침식은 객체의 크기는 확대되고 배..
컴퓨터 비전 영상처리 - 연결요소 (화소의 모양과 연결성, 범람채움) Python 실습 코드 화소처리란? 화소처리는 입력 영상의 화소값이 수학적인 함수를 거쳐서 새로운 값으로 변경된 후에 출력 영상의 동일한 위치에 저장하는 것을 말한다. 화소의 모양과 연결성 화소의 모양 화소의 연결 4-연결성과 8-연결성 메모리를 적게 사용하는 범람 채움 코드 b를 l로 복사한다. 이때 0은 0, 1은 -1로 복사 //-1은 아직 번호를 안 붙였음을 표시함 l의 경계. 즉 j = 0, j = M-1, i = 0, i = N-1인 화소를 0으로 설정 //영상 바깥으로 나가는 걸 방지하기 위함 label = 1; for(j = 1 to M-2) for(i = 1 to N-2) { if(l(j, i) = -1) { efficient_floodfill4(l, j, i, label); label++; } } //메모리를..
영상처리 - 이진화와 오츄 알고리즘 (Otsu Algorithm) 이진화 명암 영상을 흑과 백으로만 이루어진 이진 영상으로 반환한다. T보다 크거나 같으면 1(백), 작으면 0(흑)으로 해서 흑백영상을 만든다. (이진화를 시킨다) 임계값 방법 두 봉우리 사이의 계곡을 임계값 T로 설정한다. 자연 영상에서는 계곡 지점의 결정이 어렵다. 위의 (b)그림은 임계값을 50으로 설정하여 구한 이진 영상이다. 근데 임계값 T는 어떻게 구해야 될까? 이론적으로 봤을 때 이진화에 따른 분류 에러를 최소화시켜주는 임계값을 optimal threshold라고 부른다. T가 optimal threshold 인지 아닌지를 알려면 어떤 픽셀이 물체이고, 어떤 픽셀이 배경인지를 알고 있어야 하는데, 이걸 미리 알고 있었다면 이미 최적의 이진화가 끝난 상태이므로 T를 구할 필요가 없다. 실제 입..
영상처리 - 샘플링과 양자화 / 히스토그램의 정규화 평활화 역투영 영상처리 주어진 목적을 달성하기 위해 원래 영상을 새로운 영상으로 변환 컴퓨터 비전의 전처리 과정 샘플링과 양자화 2차원 영상 공간을 MxN으로 샘플링 (MxN을 해상도라고 부른다) 명암을 L단계로 양자화 (L을 명암 단계라고 한다. 즉, 명암은 0부터 L-1에 분포되어 있다. ) 위의 사진은 M이 12, N이 12, 그리고 명암 단계 L은 10인 경우이다. (c) 디지털 영상을 보면, 명암이 0부터 9까지 분포되어 있는 것을 볼 수 있다. 명암이 가장 높은 부분은 9이고 흰 배경은 0이다. 영상 좌표계 화소 위치는 x = (j, i) 또는 x = (y, x)로 표기한다. 영상은 f(x) 또는 f(j, i), 0

728x90