728x90
반응형
Computer Vision Task의 종류
Semantic Segmentation
사진 속에 어떤 대상이 나타나는지 식별
다만 대상 별 개수를 셀 수 없음
이는 그저 해당 군집(class)에 맞는 픽셀로 지정하는 것뿐이라서
sliding window를 이용하여 분류 문제로 처리할 수 있다.
각 픽셀 별로 축소된 이미지를 unpooling(upsampling) 하면서 커지게 생성하는 식으로 진행
Semantic Segmentation Encoder-Decoder Model이라고도 부르며, 대표적으로 FCN(Fully Convoluitonal Network)가 있다
인접 픽셀의 값을 복사해가면서 진행
Instance Segmentation
각 클래스마다 개수를 셀 수 있다
대표적으로 Mask RCNN이 있다
Mask RCNN = Faster RCNN + FCN
출처
http://cs231n.stanford.edu/slides/2017/cs231n_2017_lecture11.pdf
https://techblog-history-younghunjo1.tistory.com/193
https://manipulation.csail.mit.edu/segmentation.html
728x90
반응형
'Machine Learning > 초단순정리' 카테고리의 다른 글
Attention - Transformer Architecture (0) | 2021.12.22 |
---|---|
GAN (0) | 2021.11.26 |
Latent Space Interpolation (0) | 2021.11.26 |
Sequence Bias (0) | 2021.11.18 |
[Python] Sigmoid (0) | 2021.08.13 |