BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models on ShortScience.org

BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models
Junnan Li and Dongxu Li and Silvio Savarese and Steven Hoi
arXiv e-Print archive - 2023 via Local arXiv
Keywords: cs.CV
more

Write your summary here (You can use $\LaTeX$ and markdown syntax):

Anon Private