본문 바로가기

갈아먹는 머신러닝 시리즈/컴퓨터 비전

(17)
갈아먹는 Pose Estimation [1] DeepPose: Human Pose Estimation via Deep Neural Networks 들어가며 오늘 리뷰할 논문은 Pose Estimation 분야에 최초로 딥 러닝을 적용한 Deep Pose 논문입니다. 본격적으로 딥 러닝을 이용한 포즈 에스티메이션의 포문을 열었으며, 당시만하더라도 딥 러닝을 클래시피케이션에만 사용하였는데, 리그레션 문제에도 훌륭하게 적용할 수 있다는 것을 보여준 논문입니다. 영향력: 구글에서 나온 페이퍼로 인용 횟수가 1300회에 달합니다. 주요 기여: Pose Estimation 분야에 최초로 딥 러닝을 적용하여 state of the art를 달성하였습니다. Deep Learning Model for Pose Estimation 컴퓨터 비젼 분야에서 CNN이 워낙 뛰어난 성능을 내는 것은 잘 알려져 있지만, Pose Estimation 분야에서 특히 CNN이 적합..
갈아먹는 Object Detection [6] SSD: SIngle Shot Multibox Detector 지난 글 갈아먹는 Object Detection [1] R-CNN 갈아먹는 Object Detection [2] Spatial Pyramid Pooling Network 갈아먹는 Object Detection [3] Fast R-CNN 갈아먹는 Object Detection [4] Faster R-CNN 갈아먹는 Object Detection [5] Yolo:You Only Look Once 들어가며 오늘 리뷰할 논문은 yolo의 뒤를 잇는 1 Step object detection 알고리즘, SSD입니다. 먼저 결과부터 보시죠. Yolo는 속도 측면에서 당시 Faster R-CNN이 7FPS이었던 것을 45FPS까지 끌어올리는 비약적인 발전을 이루었습니다. 하지만 정확도 측면에선 다소 한계점이 있었습니..
갈아먹는 Object Detection [5] Yolo: You Only Look Once 지난 글 갈아먹는 Object Detection [1] R-CNN 갈아먹는 Object Detection [2] Spatial Pyramid Pooling Network 갈아먹는 Object Detection [3] Fast R-CNN 갈아먹는 Object Detection [4] Faster R-CNN 들어가며 오늘 리뷰할 논문은 real time object detection의 혁명을 몰고 온 yolo입니다. 우선 결과부터 보시죠. Yolo는 2015년에 나온 논문으로 Faster R-CNN에 비하여 부려 6배 가량 빠른 속도를 보입니다. 정확도는 비록 조금 낮다 하더라고 정말 비약적인 발전이라 할 수 있네요! 영향력: Joseph Redmon라는 사람이 1 저자이며 R-CNN의 Ross가 3 저자로..
갈아먹는 Semantic Segmentation [1] Fully Convolutional Network 들어가며 이번에 리뷰해 볼 논문은 Fully Convolutional Network[1]입니다.(이하 FCN) 이전까지 Semantic Segmentation 분야에서는 각 픽셀 별로 일정한 Bouding Box 크기 만큼 Classification을 적용하여 해당 픽셀의 종류를 추론하는 비효율적인 방식의 접근들이 있었습니다. 하지만 이 논문은 Fully Connected Layer 대신 1x1 컨볼루션을 사용하여 연산량을 획기적으로 줄였고, Segmentation의 퀄리티까지 높이는 성과를 내었습니다. 이 기법은 이후 많은 논문들에서 사용되면서 컴퓨터 비젼 분야 전체에 영향을 주었습니다. 그럼 시작해보겠습니다! 영향력: 인용 횟수가 약 14000회에 달하며, 다른 컴퓨터 비젼 분야의 접근들에게도 많은 ..
갈아먹는 Object Detection [4] Faster R-CNN 지난 글 갈아먹는 Object Detection [1] R-CNN 갈아먹는 Object Detection [2] Spatial Pyramid Pooling Network 갈아먹는 Object Detection [3] Fast R-CNN 들어가며 Fast-RCNN에 이어서 오늘은 Faster R-CNN[1]을 리뷰해보도록 하겠습니다. 본격적으로 Real Time Object Detection의 포문을 연 논문이라고 할 수 있겠습니다. Mask R-CNN이 남긴 했지만 그동안 열심히 리뷰해오던 R-CNN Object Detection의 마지막 논문이라니 좀 시원 섭섭하네요. 아무튼, 시작해보겠습니다! 영향력: SPPNet의 Kaming He와 R-CNN 창시자인 Ross가 각각 2저자 3저자로 참여했으며, ..
갈아먹는 Face Detection [1] MTCNN 들어가며 이번에는 CNN을 활용하여 얼굴 검출 분야에서 정확도와 성능을 끌어올린 MTCNN[1] 논문을 리뷰해보도록 하겠습니다. 얼굴 검출 분야에서 높은 성능과 빠른 속도를 보여주어 아직도 많은 논문들과 프로젝트들에서 사용됩니다. 페이퍼 자체는 5쪽 밖에 되어 처음에는 좋아했으나 ㅎㅎ 생략되어 있는 부분이 많아서 오히려 더 고생한 기억이 납니다. 빠진 부분은 소스 코드 구현체[2]를 참고하거나 블로그 포스팅 등을 참고했으며, 약간의 상상력을 보탰습니다. 그럼 시작하겠습니다! 영향력: CNN을 이용해서 얼굴 검출 정확도를 95% 수준까지 끌어올렸으며 약 1300회 인용되었습니다. 주요 기여: face detection, bounding box regression, face alignment 세 가지 테스크..
갈아먹는 Object Detection [3] Fast R-CNN 지난 글 갈아먹는 Object Detection [1] R-CNN 갈아먹는 Object Detection [2] Spatial Pyramid Pooling Network 들어가며 지난 시간 SPPNet에 이어서 오늘은 Fast R-CNN[1]을 리뷰해보도록 하겠습니다. 저 역시 그랬고, 많은 분들이 R-CNN 다음으로 Fast R-CNN 논문을 보시는데요, 해당 논문을 보다 보면 SPPNet에서 많은 부분들을 참고한 것을 확인할 수 있습니다. 특히나 핵심인 Spatial Pyramid Pooling은 중요한 개념이므로 리뷰하고 넘어가도록 하겠습니다. 영향력: R-CNN 저자인 Ross가 1 저자로 인용 횟수만 8000회에 달합니다. 주요 기여: CNN fine tuning, boundnig box reg..
갈아먹는 Object Detection [2] Spatial Pyramid Pooling Network 지난 글 갈아먹는 Object Detection [1] R-CNN 들어가며 지난 시간 R-CNN에 이어서 오늘은 SPP-Net[1]을 리뷰해보도록 하겠습니다. 저 역시 그랬고, 많은 분들이 R-CNN 다음으로 Fast R-CNN 논문을 보시는데요, 해당 논문을 보다 보면 SPPNet에서 많은 부분들을 참고한 것을 확인할 수 있습니다. 특히나 핵심인 Spatial Pyramid Pooling은 중요한 개념이므로 리뷰하고 넘어가도록 하겠습니다. 영향력: ResNet으로 유명한 Kaming He가 1 저자로 인용 횟수만 3600회에 달합니다. 주요 기여: 입력 이미지 크기와 상관없이 CNN을 적용할 수 있도록 하는 Spatial Pyramid Pooling 기법을 제안하였습니다. 핵심 아이디어 기존의 CNN ..