Computer Vision

-
Accepted at ICLR 2024 Conference LoRA 업그레이드 버전 저자는 SAM의 한계점을 명시하면서 이를 해결하기 위한 method를 제안함. 이때, 좀 더 efficient하면서 여러 도메인에서 general하게 쓸 수 있는 LoRA 기반의 새로운 PEFT method를 제안 Convolution Meets LoRA: Parameter Efficient Finetuning for Segment Anything Model The Segment Anything Model (SAM) stands as a foundational framework for image segmentation. While it exhibits remarkable zero-shot generalization in ..
Convolution Meets LoRA: Parameter Efficient Finetuning for Segment Anything Model (2024.01)Accepted at ICLR 2024 Conference LoRA 업그레이드 버전 저자는 SAM의 한계점을 명시하면서 이를 해결하기 위한 method를 제안함. 이때, 좀 더 efficient하면서 여러 도메인에서 general하게 쓸 수 있는 LoRA 기반의 새로운 PEFT method를 제안 Convolution Meets LoRA: Parameter Efficient Finetuning for Segment Anything Model The Segment Anything Model (SAM) stands as a foundational framework for image segmentation. While it exhibits remarkable zero-shot generalization in ..
2024.03.07 -
sam 코드에 대해 분석해보려고 한다. Github : https://github.com/facebookresearch/segment-anything/tree/main Image Encoder - Image embedding 생성 실제 이미지를 image embedding으로 변환 x image [bs, 3, 1024, 1024] [1] patch map 생성 x = self.patch_embed(x) # [b, h, w, c] PatchEmbed() : image -> patch map def forward(self, x: torch.Tensor) -> torch.Tensor : x = self.proj(x) # Cov2d(3, 768, (16,16), (16,16)) # B C H W -> B H W..
[SAM] 코드 리뷰sam 코드에 대해 분석해보려고 한다. Github : https://github.com/facebookresearch/segment-anything/tree/main Image Encoder - Image embedding 생성 실제 이미지를 image embedding으로 변환 x image [bs, 3, 1024, 1024] [1] patch map 생성 x = self.patch_embed(x) # [b, h, w, c] PatchEmbed() : image -> patch map def forward(self, x: torch.Tensor) -> torch.Tensor : x = self.proj(x) # Cov2d(3, 768, (16,16), (16,16)) # B C H W -> B H W..
2023.12.29