Đây là mô hình chuyển giọng nói thành văn bản tốt nhất hiện có! Nó nhanh như chớp và hoạt động với hơn 99 ngôn ngữ. Các tính năng chính: - 30 phút âm thanh được xử lý trong < 24 giây - Độ chính xác 93,3% - Hỗ trợ nhận diện và phân loại nhiều người nói - Được đào tạo trên 12,5 triệu giờ dữ liệu đa ngôn ngữ (99 ngôn ngữ) Trong video demo bên dưới, tôi thực hiện một bài kiểm tra trực tiếp về mô hình SST hàng đầu của @AssemblyAI, Universal. Bạn có thể sử dụng điều này để chuyển đổi lên đến 300 giờ âm thanh MIỄN PHÍ! Tôi đã chia sẻ liên kết đến sân chơi trong tweet tiếp theo!