整整一分鐘的情感、純淨的歌唱——而且還是用日語。我們的新模型能夠在不到6秒的時間內生成。 我們對@XVisualneuFX(以及我們自己)感到非常驚訝。