AimeSpeech

AimeSpeech : 音声認識、音声合成、話者認識

AimeSpeechは、Aimenicornソフトウェアエコシステム内の重要な音声処理フレームワークです。 AimeSpeechには、音声認識エンジン(Speech to Text、STTエンジン)、音声合成エンジン(Text to Speech、TTSエンジン)、話者識別ライブラリ、およびその他の優越な音声処理ライブラリが含まれています。 AimeSpeechは、英語、日本語、ベトナム語の3つの言語に対応しています。 オンプレミスおよびクラウド上で運用が可能です。 AimeSpeechは、AimeHotel、AimeReception、Aime AIShopなど、AimesoftのさまざまなマルチモーダルAI製品に適用されます。

デモ

coverproduct

AimeSpeechの優れた機能

  • content
    音声認識 (Speech-to-Text, STT)
  • content
    感情分析
  • content
    音声合成 (Text-to-Speech, TTS)
  • content
    話者識別
  • content
    音声特徴量からの評判分析
  • content
    英語、日本語、ベトナム語に対応
cover

AimeSpeechに搭載されたテクノロジー

AimeSpeechを実現するための技術

  • product
    音声認識技術
    DNN (Deep Neural Networks)、 LSTM、 GMM、 HMM、 音響モデリング, 言語モデル
  • product
    自然言語処理技術
    形態素解析、キーワード抽出、同義語・対義語検出、情報抽出、関係抽出、セマンティックサーチ、自然言語理解
  • product
    音声合成技術
    HMM, Festival, Kaldi, Tacotron2, DNN, Vocoder
  • product
    話者識別技術
    GMM, VGG network

AimeSpeechが選ばれる理由

我々AIMESOFTはマルチモーダルAIを導入したソリューションを提供しております