Ưu điểm nổi trội:
- Đa dạng giọng đọc (Bắc/Nam, Nam/Nữ);
- Áp dụng công nghệ tiên tiến nhất (End-to-End);
- Tổng hợp được nhiều giọng đọc với ngữ điệu tự nhiên như con người (MOS > 4.0);
- Tốc độ tổng hợp song song nhanh: <10 giây để tổng hợp 2.000 ký tự (tương đương 1 trang A4 full-text font 13, hoặc 500-600 từ);
- Tổng hợp được nhiều ngôn ngữ (Việt, Anh, Trung, Nhật);
- Dễ dàng học bổ sung giọng mới với lượng mẫu nhỏ chỉ 30 phút audio;
- Tích hợp giải pháp sinh Video người nói ảo từ audio TTS theo template ảnh hoặc video mẫu tùy ý;
- Dễ dàng tích hợp với mọi hệ thống qua API.
Ứng dụng rộng rãi:
- Hệ thống tổng đài thông minh trả lời tự động.
- Các hệ thống thông báo (sân bay, bến xe, xếp hàng tự động, smarthome .v.v. ).
- Trợ lý ảo (virtual assistant), MC ảo, hướng dẫn viên ảo.
- Báo nói, sách nói.
- Thuyết minh - lồng tiếng phim/video.
- Phát thanh 4.0 (loa phường 4.0).
Hình 1: Mô hình tổng thể hệ thống tổng hợp tiếng nói
Demo phát thanh 4.0 (Giọng đọc AI + IoT)