본문 바로가기

728x90

Coloring (Additional Study)/LAB research2

Building Detection - test result (7/3) 목표차량 입장에서 건물을 포착하여 어떤 건물인지 인식해내고 gps 정보와 함께 현재 위치를 찾아내기.INPUTFlorence-2 outputSAM outputResult원하는 결과가 나오지 않는다 각 빌딩을 확실하게 bounding box처리할 수 있도록 다양한 시도를 해봐야겠다. 2024. 7. 4.

Florence-2: Advancing a Unified Representation for a Variety of Vision Tasks Florence-2Microsoft에서 아주 최근에 발표한 프롬프트 기반 Vision-Langauge foundation모델이다. 굉장히 general한 task에 대해서 높은 수행능력이 있다는 것에서 의의가 있다.FLD-5BFlorence-2의 특장점 중 하나는 작업 지시로 text prompt를 받아 원하는 결과를 텍스트 형식으로 생성하는 능력이다. 이러한 multi-task에 대한 수행능력은 대규모의 고품질 annotated 데이터가 필요하며, 이를 위해 FLD-5B 데이터셋이 개발되었다. 이 데이터셋은 1억 2천 6백만 개의 이미지에 대한 54억 개의 종합적인 시각 주석을 포함하며, 자동 데이터 엔진을 사용하여 종합적인 시각 주석을 생성하는 방식으로 개발되었다. 데이터 엔진은 핵심적인 두 가지 m.. 2024. 7. 1.

이전 1 다음

728x90

티스토리툴바