AimeSpeech

AimeSpeech : Nhận diện tiếng nói, nhận diện người nói, tổng hợp tiếng nói

AimeSpeech là một framework cốt lõi về xử lý giọng nói bên trong hệ sinh thái phần mềm Aimenicorn. AimeSpeech bao gồm công cụ nhận dạng giọng nói (Speech to Text, STT engine), công cụ tổng hợp giọng nói (Text to Speech, TTS engine), thư viện nhận dạng người nói và các thư viện xử lý giọng nói nâng cao khác. AimeSpeech hỗ trợ tiếng Anh, tiếng Nhật và tiếng Việt. Framework có thể được triển khai tại máy tính và cả trên các nền tảng điện toán đám mây. AimeSpeech được ứng dụng trong nhiều sản phẩm Multimodal AI của Aimesoft, như AimeHotel, AimeReception, Aime AIShop, ...

Dùng thử

coverproduct

AimeSpeech và các tính năng

  • content
    Nhận dạng giọng nói (Chuyển giọng nói thành văn bản, STT)
  • content
    Phân tích cảm xúc
  • content
    Tổng hợp giọng nói (Chuyển văn bản thành giọng nói, TTS)
  • content
    Nhận dạng người nói
  • content
    Phân tích quan điểm từ các tính năng giọng nói
  • content
    Hỗ trợ tiếng Anh, tiếng Nhật, tiếng Việt
cover

AimeSpeech ứng dụng các công nghệ

Các công nghệ của Aimesoft để xây dựng AimeSpeech

  • product
    Công nghệ nhận dạng giọng nói
    DNN (Deep Neural Networks), LSTM, GMM, HMM, mô hình âm thanh, mô hình ngôn ngữ
  • product
    Công nghệ xử lý ngôn ngữ tự nhiên
    Mã hóa, gắn thẻ POS, trích xuất từ ​​khóa, chuẩn hóa từ
  • product
    Công nghệ tổng hợp giọng nói
    HMM, Festival, Kaldi, Tacotron2, DNN, Vocoder
  • product
    Công nghệ nhận dạng người nói
    GMM, VGG network

AimeeSpeech và các ứng dụng nổi bật

AimeFace có nhiều ứng dụng trong thực tế