Top
AimeSpeech

AimeSpeech : Nhận diện tiếng nói, nhận diện người nói, tổng hợp tiếng nói

 

AimeSpeech là một framework cốt lõi về xử lý giọng nói bên trong hệ sinh thái phần mềm Aimenicorn. AimeSpeech bao gồm công cụ nhận dạng giọng nói (Speech to Text, STT engine), công cụ tổng hợp giọng nói (Text to Speech, TTS engine), thư viện nhận dạng người nói và các thư viện xử lý giọng nói nâng cao khác. AimeSpeech hỗ trợ tiếng Anh, tiếng Nhật và tiếng Việt. Framework có thể được triển khai tại máy tính và cả trên các nền tảng điện toán đám mây. AimeSpeech được ứng dụng trong nhiều sản phẩm Multimodal AI của Aimesoft, như AimeHotel, AimeReception, Aime AIShop, ...

Dùng thử

coverproduct

AimeSpeech và các tính năng

 • content
  Nhận dạng giọng nói (Chuyển giọng nói thành văn bản, STT)
 • content
  Phân tích cảm xúc
 • content
  Tổng hợp giọng nói (Chuyển văn bản thành giọng nói, TTS)
 • content
  Nhận dạng người nói
 • content
  Phân tích quan điểm từ các tính năng giọng nói
 • content
  Hỗ trợ tiếng Anh, tiếng Nhật, tiếng Việt
cover

AimeSpeech ứng dụng các công nghệ

Các công nghệ của Aimesoft để xây dựng AimeSpeech

 • product
  Công nghệ nhận dạng giọng nói
  DNN (Deep Neural Networks), LSTM, GMM, HMM, mô hình âm thanh, mô hình ngôn ngữ
 • product
  Công nghệ xử lý ngôn ngữ tự nhiên
  Mã hóa, gắn thẻ POS, trích xuất từ ​​khóa, chuẩn hóa từ
 • product
  Công nghệ tổng hợp giọng nói
  HMM, Festival, Kaldi, Tacotron2, DNN, Vocoder
 • product
  Công nghệ nhận dạng người nói
  GMM, VGG network

AimeSpeech và các ứng dụng nổi bật

AimeSpeech có nhiều ứng dụng trong thực tế