Hướng dẫn API chuyển văn bản thành giọng nói (TTS)

Tổng quan

API âm thanh cung cấp endpoint speech, dựa trên mô hình TTS để thực hiện các chức năng sau:

📝 Đọc bài viết blog

🌍 Tạo âm thanh đa ngôn ngữ

🎵 Xuất luồng âm thanh theo thời gian thực

Lưu ý quan trọng: Phải thông báo cho người dùng rằng giọng nói họ nghe được là do AI tạo ra, không phải giọng người thật

Sử dụng cơ bản

Ví dụ cơ bản

Tính năng

Tùy chọn chất lượng âm thanh

tts-1: Độ trễ thấp, phù hợp với ứng dụng thời gian thực

tts-1-hd: Chất lượng cao hơn, có thể có ít nội dung tĩnh hơn

Giọng có sẵn

alloy

echo

fable

nova

shimmer

onyx

Các định dạng đầu ra được hỗ trợ

Định dạng	Đặc điểm	Kịch bản sử dụng
MP3	Định dạng mặc định	Kịch bản tổng quát
Opus	Độ trễ thấp	Truyền phát mạng và giao tiếp
AAC	Nén hiệu quả	Phát lại trên thiết bị di động
FLAC	Nén không mất dữ liệu	Lưu trữ âm thanh
WAV	Không nén	Ứng dụng độ trễ thấp
PCM	Mẫu thô	24kHz, 16-bit có dấu

Luồng âm thanh thời gian thực

Ngôn ngữ được hỗ trợ

Hỗ trợ nhiều ngôn ngữ, bao gồm:

Ngôn ngữ châu Á: tiếng Trung, tiếng Nhật, tiếng Hàn, v.v.

Ngôn ngữ châu Âu: tiếng Anh, tiếng Pháp, tiếng Đức, v.v.

Ngôn ngữ khác: tiếng Ả Rập, tiếng Hindi, v.v.

Lưu ý: Hiện tại các giọng nói chủ yếu được tối ưu cho tiếng Anh

Câu hỏi thường gặp

Q: Làm thế nào để kiểm soát cảm xúc của âm thanh được tạo ra?

A: Hiện tại chưa có cơ chế kiểm soát trực tiếp. Chữ in hoa hoặc cú pháp có thể ảnh hưởng đến đầu ra, nhưng hiệu quả không निश्चित.

Q: Có thể tạo giọng nói tùy chỉnh không?

A: Không hỗ trợ tạo giọng nói tùy chỉnh.

Q: Quyền sở hữu của âm thanh được tạo ra?

A: Thuộc về người tạo, nhưng cần thông báo cho người dùng rằng đây là âm thanh do AI tạo ra."

Python sử dụng chuyển đổi văn bản thành giọng nói

Hướng dẫn API chuyển văn bản thành giọng nói (TTS)#

Tổng quan#

Sử dụng cơ bản#

Ví dụ cơ bản#

Tính năng#

Tùy chọn chất lượng âm thanh#

Giọng có sẵn#

Các định dạng đầu ra được hỗ trợ#

Luồng âm thanh thời gian thực#

Ngôn ngữ được hỗ trợ#

Câu hỏi thường gặp#

Q: Làm thế nào để kiểm soát cảm xúc của âm thanh được tạo ra?#

Q: Có thể tạo giọng nói tùy chỉnh không?#

Q: Quyền sở hữu của âm thanh được tạo ra?#