speech, dựa trên mô hình TTS để thực hiện các chức năng sau:Lưu ý quan trọng: Phải thông báo cho người dùng rằng giọng nói họ nghe được là do AI tạo ra, không phải giọng người thật
| Định dạng | Đặc điểm | Kịch bản sử dụng |
|---|---|---|
| MP3 | Định dạng mặc định | Kịch bản tổng quát |
| Opus | Độ trễ thấp | Truyền phát mạng và giao tiếp |
| AAC | Nén hiệu quả | Phát lại trên thiết bị di động |
| FLAC | Nén không mất dữ liệu | Lưu trữ âm thanh |
| WAV | Không nén | Ứng dụng độ trễ thấp |
| PCM | Mẫu thô | 24kHz, 16-bit có dấu |
Lưu ý: Hiện tại các giọng nói chủ yếu được tối ưu cho tiếng Anh