Trikang

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

Trikang

[Large Language Model 논문 정리] MINIGPT-4: ENHANCING VISION-LANGUAGE UNDERSTANDING WITH ADVANCED LARGE LANGUAGE MODELS

MiniGPT-4는 처음에 4개의 A100 GPU에서 256 배치 크기를 사용하여 20,000 번의 학습을 진행하며, LAION, Conceptual Captions, SBU의 이미지를 포함하는 combined image captioning dataset을 활용하여 visual features를 Vicuna language model과 align한다. 그럼에도 불구하고, 단지 LLM과 visual features를 align하는 것으로는 챗봇처럼 강력한 visual conversation(시각적 대화) 기능을 보장하기에는 불충분하다. raw 이미지-텍스트 쌍에 기본 노이즈가 있으면 언어 출력이 수준 이하로 떨어질 수 있다. 따라서 생성된 언어의 자연스러움과 사용성을 개선하기 위해 3,500개의 상세한..

공부/ML 2024. 4. 4. 02:47

NeRF LLFF dataset을 3D Gaussian Splatting의 Input으로 넣기

기본적으로 NeRF LLFF 데이터 셋은 3D-GS에서 동작하지 않는다. LLFF 데이터 셋은 SIMPLE_RADIAL 카메라 모델을 사용하고 있는 . 것같다. PINHOLE or SIMPLE_PINHOLE -> undistorted dataset AssertionError: Colmap camera model not handled: only undistorted datasets (PINHOLE or SIMPLE PINHOLE cameras) supported! 그래서 아래와 같은 가공 절차를 거쳐서 작동하도록 수정했다. 기존 llff 데이터 셋에 대해 COLMAP을 이용한 가공 진행 image_undistorter를 이용해서 3D-GS가 읽을 수 있는 카메라 모델로 변경. 아래는 fern 데이터에 대한..

공부/ML 2024. 3. 26. 14:23

Nerfstudio에서 ODM(OpenDroneMap)을 이용해 전처리한 데이터 사용하기 + 3D Gaussian Splatting Nerfstudio에서 학습하기

드론 매핑을 이용한 데이터 전처리 OpenDroneMap이 docker 버전으로 설치되어 있다고 가정 docker run -ti --rm -v {local directory}:{docker volume에서의 directory} opendronemap/odm --project-path {docker volume에서의 directory} {프로젝트 명} {옵션} 아래는 local directory: /home/user/data/odm_dataset docker volume에서의 directory: /datasets 프로젝트 명: drone-230706-1722-25-fastortho 이라고 가정하였을 때의 코드 예시 * 여기서, local directory 안에 '프로젝트 명' 폴더를 하나 만들고, 그 안에..

공부/ML 2024. 3. 25. 15:07

Prev 1 ··· 3 4 5 6 7 8 9 ··· 14 Next

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

Trikang

Trikang

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역