Trikang

MiniGPT-4는 처음에 4개의 A100 GPU에서 256 배치 크기를 사용하여 20,000 번의 학습을 진행하며, LAION, Conceptual Captions, SBU의 이미지를 포함하는 combined image captioning dataset을 활용하여 visual features를 Vicuna language model과 align한다. 그럼에도 불구하고, 단지 LLM과 visual features를 align하는 것으로는 챗봇처럼 강력한 visual conversation(시각적 대화) 기능을 보장하기에는 불충분하다. raw 이미지-텍스트 쌍에 기본 노이즈가 있으면 언어 출력이 수준 이하로 떨어질 수 있다. 따라서 생성된 언어의 자연스러움과 사용성을 개선하기 위해 3,500개의 상세한..

기본적으로 NeRF LLFF 데이터 셋은 3D-GS에서 동작하지 않는다. LLFF 데이터 셋은 SIMPLE_RADIAL 카메라 모델을 사용하고 있는 . 것같다. PINHOLE or SIMPLE_PINHOLE -> undistorted dataset AssertionError: Colmap camera model not handled: only undistorted datasets (PINHOLE or SIMPLE PINHOLE cameras) supported! 그래서 아래와 같은 가공 절차를 거쳐서 작동하도록 수정했다. 기존 llff 데이터 셋에 대해 COLMAP을 이용한 가공 진행 image_undistorter를 이용해서 3D-GS가 읽을 수 있는 카메라 모델로 변경. 아래는 fern 데이터에 대한..
드론 매핑을 이용한 데이터 전처리 OpenDroneMap이 docker 버전으로 설치되어 있다고 가정 docker run -ti --rm -v {local directory}:{docker volume에서의 directory} opendronemap/odm --project-path {docker volume에서의 directory} {프로젝트 명} {옵션} 아래는 local directory: /home/user/data/odm_dataset docker volume에서의 directory: /datasets 프로젝트 명: drone-230706-1722-25-fastortho 이라고 가정하였을 때의 코드 예시 * 여기서, local directory 안에 '프로젝트 명' 폴더를 하나 만들고, 그 안에..