Top

AimeSpeech : Nhận dạng tiếng nói, nhận diện người nói, tổng hợp tiếng nói

AimeSpeech là nền tảng về xử lý giọng nói bên trong hệ sinh thái phần mềm trí tuệ nhân tạo đa thể thức Aimenicorn. AimeSpeech bao gồm công cụ nhận dạng giọng nói (Speech to Text, STT engine, ASR), công cụ tổng hợp giọng nói (Text to Speech, TTS engine), thư viện nhận dạng người nói và các thư viện xử lý giọng nói nâng cao khác. AimeSpeech hỗ trợ tiếng Anh, tiếng Nhật, tiếng Hàn và tiếng Việt. AimeSpeech có thể được triển khai tại máy tính cá nhân/máy chủ (on-premise) và cả trên các nền tảng điện toán đám mây (on-cloud). AimeSpeech còn có thể chạy ngay trên các thiết bị như điện thoại thông minh (smartphone) hoặc edge device, không cần có kết nối Internet. AimeSpeech được ứng dụng trong nhiều sản phẩm Multimodal AI của Aimesoft, như AimeHotel, AimeReception, Aime AIShop, ...

Bấm vào các nút dưới đây để dùng thử AimeSpeech (các trang Web demo nhận diện tiếng nói, tổng hợp tiếng nói này chỉ chạy với trình duyệt Google Chrome trên máy tính, không chạy trên smartphone và các trình duyệt khác. Automatic Speech Recognition (ASR), Speech Synthesis (TTS) API, SDK của AimeSpeech chạy tốt trên cả máy tính và smartphone cũng như các thiết bị khác).

Dùng thử TTS Dùng thử STT / ASR

AimeSpeech và các tính năng

Nhận dạng giọng nói (Chuyển tiếng nói thành văn bản, STT, ASR)
Phân tích cảm xúc
Tổng hợp tiếng nói (Chuyển văn bản thành giọng nói, TTS)
Nhận dạng, nhận diện người nói
Chạy trên máy tính, điện thoại, on-premise
Hỗ trợ tiếng Anh, tiếng Nhật, tiếng Hàn, tiếng Việt

AimeSpeech ứng dụng các công nghệ

Các công nghệ của Aimesoft để xây dựng AimeSpeech

Công nghệ nhận dạng giọng nói

DNN (Deep Neural Networks), LSTM, GMM, HMM, mô hình âm thanh, mô hình ngôn ngữ
Công nghệ xử lý ngôn ngữ tự nhiên

Mã hóa, gắn thẻ POS, trích xuất từ khóa, chuẩn hóa từ
Công nghệ tổng hợp giọng nói

HMM, Festival, Kaldi, Tacotron2, DNN, Vocoder
Công nghệ nhận dạng người nói

GMM, VGG network

AimeSpeech và các ứng dụng nổi bật

AimeSpeech có nhiều ứng dụng trong thực tế

Call center tự động
Nhận dạng, xác thực đa phương thức (sử dụng cả khuôn mặt và giọng nói)
AimeReception: Nhân viên lễ tân ảo với GUI và VUI (Voice User Interface)
AimeHotel: nhân viên khách sạn ảo
AimeBank: xác thực người dùng ngân hàng
AimeTalk: người thuyết trình ảo

Dùng thử TTS

The FIRST Company to Develop Multimodal AI with 200+ Installations Worldwide

The FIRST Company to Develop Multimodal AI with 200+ Installations Worldwide

AimeSpeech : Nhận dạng tiếng nói, nhận diện người nói, tổng hợp tiếng nói

AimeSpeech và các tính năng

AimeSpeech ứng dụng các công nghệ

AimeSpeech và các ứng dụng nổi bật