러닝머신의 머신러닝

  • 홈
  • 태그
  • 방명록

Clip 2

[논문 리뷰] LERF: Language Embedded Radiance Fields

안녕하세요. 오늘 리뷰해볼 논문은 LERF: Language Embedded Radiance Fields입니다. LERF는 주어진 scene에서 자연어를 통해 대상을 찾아내고 NeRF처럼 해당 객체에 대해 입체적인 모습은 추론하는 모델입니다. https://arxiv.org/abs/2303.09553 LERF: Language Embedded Radiance Fields Humans describe the physical world using natural language to refer to specific 3D locations based on a vast range of properties: visual appearance, semantics, abstract associations, or acti..

Computer Vision/NeRF 2023.03.31

[논문 리뷰] Learning Transferable Visual Models From Natural Language Supervision (CLIP)

안녕하세요. 오늘 리뷰할 논문은 OpenAI에서 발표한 Learning Transferable Visual Models From Natural Language Supervision이라는 논문으로, 보통 CLIP이라고 많이 부르기도 합니다. 개인적으로 해당 논문을 기점으로 Multimodal 관련 연구가 엄청나게 활발하게 진행되었고, CLIP이 여러 task에서도 활용이 되는 모습을 보여주었습니다. CLIP은 image encoder에서 뽑아내는 embedding과 text encoder에서 뽑아내는 embedding이 같은 embedding space를 공유하도록 학습하는 것이 목적이고 가장 중요한 부분이라고 보시면 됩니다. Text encoder와 image encoder가 embedding space..

Vision & Language 2022.11.13
이전
1
다음
더보기
프로필사진

  • 분류 전체보기 (22)
    • Computer Vision (17)
      • Transformer (5)
      • NeRF (7)
      • Diffusion (0)
      • GAN (1)
    • Vision & Language (3)
    • Natural Language Processing (1)
    • Python (0)
    • 기타 (1)

Tag

머신러닝, Computer Vision, LERF, Mae, SNeRG, MobileNeRF, Token merging, vision transformer, multimodal, Clip, GPT, Masked autoencoder, Segment Anything, Machine learning, deep learning, NERF, transformer, Vit, 딥러닝, Object Detection,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

  • 안녕하세요

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바