Trikang
knn 함수를 수정할 필요가 있어서 simple-knn 모듈 내의 spatial.h, spatial.cu에 knn2 함수를 추가해줬다. // spatial.h #include torch::Tensor distCUDA2(const torch::Tensor& points); torch::Tensor knn2(const torch::Tensor& points); 그리고 이를 빌드하기 위해 ext.cpp를 아래처럼 수정했다 #include #include "spatial.h" PYBIND11_MODULE(TORCH_EXTENSION_NAME, m) { m.def("distCUDA2", &distCUDA2); m.def("knn2", &knn2); // 추가 } 이후 gaussian-splatting 루트 디렉토..
train.py의 main 함수 전체 구조 if __name__ == "__main__": # Set up command line argument parser parser = ArgumentParser(description="Training script parameters") lp = ModelParams(parser) op = OptimizationParams(parser) pp = PipelineParams(parser) parser.add_argument('--ip', type=str, default="127.0.0.1") parser.add_argument('--port', type=int, default=6009) parser.add_argument('--debug_from', type=int,..
MiniGPT-4는 처음에 4개의 A100 GPU에서 256 배치 크기를 사용하여 20,000 번의 학습을 진행하며, LAION, Conceptual Captions, SBU의 이미지를 포함하는 combined image captioning dataset을 활용하여 visual features를 Vicuna language model과 align한다. 그럼에도 불구하고, 단지 LLM과 visual features를 align하는 것으로는 챗봇처럼 강력한 visual conversation(시각적 대화) 기능을 보장하기에는 불충분하다. raw 이미지-텍스트 쌍에 기본 노이즈가 있으면 언어 출력이 수준 이하로 떨어질 수 있다. 따라서 생성된 언어의 자연스러움과 사용성을 개선하기 위해 3,500개의 상세한..