Top
AimeSpeech

AimeSpeech : Nhận dạng tiếng nói, nhận diện người nói, tổng hợp tiếng nói

 

AimeSpeech là nền tảng về xử lý giọng nói bên trong hệ sinh thái phần mềm trí tuệ nhân tạo đa thể thức Aimenicorn. AimeSpeech bao gồm công cụ nhận dạng giọng nói (Speech to Text, STT engine, ASR), công cụ tổng hợp giọng nói (Text to Speech, TTS engine), thư viện nhận dạng người nói và các thư viện xử lý giọng nói nâng cao khác. AimeSpeech hỗ trợ tiếng Anh, tiếng Nhật, tiếng Hàn và tiếng Việt. AimeSpeech có thể được triển khai tại máy tính cá nhân/máy chủ (on-premise) và cả trên các nền tảng điện toán đám mây (on-cloud). AimeSpeech còn có thể chạy ngay trên các thiết bị như điện thoại thông minh (smartphone) hoặc edge device, không cần có kết nối Internet. AimeSpeech được ứng dụng trong nhiều sản phẩm Multimodal AI của Aimesoft, như AimeHotel, AimeReception, Aime AIShop, ...

Bấm vào các nút dưới đây để dùng thử AimeSpeech (các trang Web demo nhận diện tiếng nói, tổng hợp tiếng nói này chỉ chạy với trình duyệt Google Chrome trên máy tính, không chạy trên smartphone và các trình duyệt khác. Automatic Speech Recognition (ASR), Speech Synthesis (TTS) API, SDK của AimeSpeech chạy tốt trên cả máy tính và smartphone cũng như các thiết bị khác).

 

Dùng thử TTS       Dùng thử STT / ASR

coverproduct

AimeSpeech và các tính năng

  • content
    Nhận dạng giọng nói (Chuyển tiếng nói thành văn bản, STT, ASR)
  • content
    Phân tích cảm xúc
  • content
    Tổng hợp tiếng nói (Chuyển văn bản thành giọng nói, TTS)
  • content
    Nhận dạng, nhận diện người nói
  • content
    Chạy trên máy tính, điện thoại, on-premise
  • content
    Hỗ trợ tiếng Anh, tiếng Nhật, tiếng Hàn, tiếng Việt
cover

AimeSpeech ứng dụng các công nghệ

Các công nghệ của Aimesoft để xây dựng AimeSpeech

  • product
    Công nghệ nhận dạng giọng nói
    DNN (Deep Neural Networks), LSTM, GMM, HMM, mô hình âm thanh, mô hình ngôn ngữ
  • product
    Công nghệ xử lý ngôn ngữ tự nhiên
    Mã hóa, gắn thẻ POS, trích xuất từ ​​khóa, chuẩn hóa từ
  • product
    Công nghệ tổng hợp giọng nói
    HMM, Festival, Kaldi, Tacotron2, DNN, Vocoder
  • product
    Công nghệ nhận dạng người nói
    GMM, VGG network

AimeSpeech và các ứng dụng nổi bật

AimeSpeech có nhiều ứng dụng trong thực tế