os modelos de compreensão de vídeo parecem estar perto do ponto de inflexão
244