Explore Projects

Discover 3 open source projects

Active filters (1):

Search: visual-language-learning×

Showing 1-3 of 3 projects

LLaVA is a visual instruction tuning framework for large language and vision models, enabling GPT-4 level capabilities.

24.5K

Archived

Python

Computer Vision

LLM Frameworks

PyTorch

#llava#gpt-4#instruction-tuning

Code and models for a multimodal large language model that can perform any-to-any tasks

3.6K

Experimental

Python

LLM Frameworks

Agents & Orchestration

PyTorch

#chatgpt#foundation-models#gpt-4

A comprehensive multimodal system for long-term streaming video and audio interactions using large language models.

2.9K

Experimental

Python

LLM Frameworks

Computer Vision

PyTorch

#chatgpt#gpt-4#multimodal

Get weekly updates on trending AI coding tools and projects.