Hãy cùng nhau lượng tử hóa một ví dụ thực tế. 🧮 Bắt đầu với trọng số: [0.1, -0.5, 2.3, -1.8] Trong float32 → 16 byte. Mục tiêu: thu nhỏ xuống int8 (chỉ 4 byte). Làm thế nào? Hai số ma thuật: scale và zero_point. 🔑 Từng bước một 👇
436