top of page
Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
logo.png

rinna、日本語音声認識モデル「Nue ASR」発売

Generatived

2023年12月11日

rinna(東京都渋谷区)は、GPTを活用した日本語音声認識モデル「Nue ASR」を開発し、商用ライセンスで提供開始したと発表した。AI技術の進歩により、大量データから学習した基盤モデルが多くのサービスで活用されている。rinnaは、日本語処理に特化した基盤モデルを公開し、AI開発を支援しているとのこと。

同社は、GPTやHuBERTなどのモデルを組み合わせた「Nue ASR」を開発した。このモデルは、約19,000時間の日本語音声コーパスを用いて学習され、Hugging FaceでApache-2.0 Licenseに基づき公開されている。Nue ASRは、GPT構造を用い、DeepSpeedなどの手法を導入することで処理速度を向上させているという。

Nue ASRの性能は、OpenAI WhisperやReazonSpeechモデルと匹敵すると報告されている。今後もGPTの改良により、性能向上が期待される。rinnaは、音声認識・テキスト生成・音声合成を含む音声対話の研究開発を進め、AIの社会実装に貢献していく方針だとのことだ。ソース:

Generatived

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

Copyright © 2024 Generatived - All right Reserved.

bottom of page