Gemma 3 înțelege imaginile, textul și videoclipurile - toate deodată. În această analiză profundă, aflați cum modelul integrează mai multe surse și efectuează o serie de sarcini, de la răspunsul la întrebări despre documente până la descrierea scenelor vizuale în detaliu. Explorați de ce este importantă multimodalitatea.