Gemma 3 entiende imágenes, texto y video - todo a la vez. En esta profunda exploración, aprende cómo el modelo integra múltiples fuentes y realiza una variedad de tareas, desde responder preguntas sobre documentos hasta describir escenas visuales en detalle. Explora por qué la multimodalidad es importante.