Gemma 3 rozumí obrázkům, textu a videu - vše najednou. V tomto podrobném ponoru se dozvíte, jak model integruje více zdrojů a provádí řadu úkolů od odpovědí na otázky týkající se dokumentů až po podrobný popis vizuálních scén. Prozkoumejte, proč je multimodalita důležitá.