러닝머신의 머신러닝

  • 홈
  • 태그
  • 방명록

Coca 1

[논문 리뷰] CoCa: Contrastive Captioners are Image-TextFoundation Models

안녕하세요. 오늘 리뷰해볼 논문은 CoCa: Contrastive Captioners are Image-TextFoundation Models라는 논문입니다. CoCa는 Google Research에서 발표한 Vision&Language 논문입니다. CoCa는 Vision&Language 계열의 논문에서 여러 task를 해결하기 위해 제안되었던 여러가지 모델 구조를 하나의 구조로 통합한 모델이라고 합니다. (https://arxiv.org/abs/2205.01917) (해당 글은 개인적인 기록을 목적으로 잘못된 내용이 있을 수 있음을 알립니다.) 0. Abstract 해당 논문은 CLIP의 contrastive loss와 SimVLM의 generative caption loss 방식을 image-text..

Vision & Language 2022.11.17
이전
1
다음
더보기
프로필사진

  • 분류 전체보기 (22)
    • Computer Vision (17)
      • Transformer (5)
      • NeRF (7)
      • Diffusion (0)
      • GAN (1)
    • Vision & Language (3)
    • Natural Language Processing (1)
    • Python (0)
    • 기타 (1)

Tag

SNeRG, LERF, Masked autoencoder, deep learning, Segment Anything, Clip, 딥러닝, Machine learning, Token merging, vision transformer, NERF, transformer, Vit, 머신러닝, Mae, GPT, multimodal, MobileNeRF, Object Detection, Computer Vision,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

  • 안녕하세요

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바