Gemma 3 rozumie obrazy, tekst i wideo - wszystko jednocześnie. W tym dogłębnym badaniu dowiedz się, jak model integruje wiele źródeł i wykonuje szereg zadań, od odpowiadania na pytania dotyczące dokumentów po szczegółowe opisywanie scen wizualnych. Zbadaj, dlaczego multimodalność ma znaczenie.