Gemma 3 forstår bilder, tekst og video – alt på en gang. I dette dypdykket lærer du hvordan modellen integrerer flere kilder og utfører en rekke oppgaver fra å svare på spørsmål om dokumenter til å beskrive visuelle scener i detalj. Utforsk hvorfor multimodalitet er viktig.