-
Notifications
You must be signed in to change notification settings - Fork 10
Commit
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
- Loading branch information
Showing
5 changed files
with
37 additions
and
41 deletions.
There are no files selected for viewing
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -1,38 +1,38 @@ | ||
+++ | ||
title = '流式 ASR 在 SG2002 上的移植优化' | ||
title = 'SG2002上での流式ASRの移植最適化' | ||
date = 2023-12-28T15:09:10+08:00 | ||
toc = true | ||
slug = 'S2312' | ||
cid = 'S2312' | ||
award = '15000 CNY' | ||
summary = '自然语音交互是人机交互的重要形式之一,但由于高精度的 ASR 模型的运算量巨大,导致 ASR 通常在云端执行,降低了人机交互的体验感。本次竞赛旨在算能 SG2002 处理器上移植高精度的流式 ASR,可选汉语或者英语的 ASR 识别模型,目标是在受限内存 (256 MByte)、实时流式识别 (RTF < 1) 的要求下,实现尽可能低的 WER。参赛者可以参考新一代 Kaldi,Wenet 等开源语音识别项目进行移植' | ||
summary = '自然言語の音声対話は人間とコンピュータの対話の重要な形態の一つですが、高精度なASRモデルの計算量が膨大であるため、通常はクラウドでASRが実行され、人間とコンピュータのインタラクション体験が低下します。本コンテストでは、SG2002プロセッサ上で高精度な流式ASRを移植することを目指し、中国語または英語のASR認識モデルを選択できます。目標は、限られたメモリ(256Mバイト)、リアルタイムストリーミング認識(RTF < 1)の要件の下で、できるだけ低いWERを実現することです。参加者は、新世代のKaldi、Wenetなどのオープンソース音声認識プロジェクトを参考にして移植することができます。' | ||
+++ | ||
|
||
## 项目描述 | ||
## プロジェクト説明 | ||
|
||
自然语音交互是人机交互的重要形式之一,但由于高精度的 ASR 模型的运算量巨大,导致 ASR 通常在云端执行,降低了人机交互的体验感。 | ||
自然言語の音声対話は人間とコンピュータの対話の重要な形態の一つですが、高精度なASRモデルの計算量が膨大であるため、通常はクラウドでASRが実行され、人間とコンピュータのインタラクション体験が低下します。 | ||
|
||
本次竞赛旨在算能 SG2002 处理器上移植高精度的流式 ASR,可选汉语或者英语的 ASR 识别模型,目标是在受限内存 (256MByte)、实时流式识别 (RTF<1) 的要求下,实现尽可能低的 WER。 | ||
本コンテストでは、SG2002プロセッサ上で高精度な流式ASRを移植することを目指し、中国語または英語のASR認識モデルを選択できます。目標は、限られたメモリ(256Mバイト)、リアルタイムストリーミング認識(RTF < 1)の要件の下で、できるだけ低いWERを実現することです。 | ||
|
||
参赛者可以参考新一代 Kaldi,Wenet 等开源语音识别项目进行移植。 | ||
参加者は、新世代のKaldi、Wenetなどのオープンソース音声認識プロジェクトを参考にして移植することができます。 | ||
|
||
## 产出及评分要求 | ||
## 成果物および評価要件: | ||
|
||
1. 使用 SG2002 的板载麦克风进行实时离线语音识别 | ||
2. 参赛者可以使用 RVV0.7,TPU 或 SG2002 上其它可用的计算资源进行计算 | ||
3. 评审标准将对 内存占用,实时率,错误率 三方面指标进行综合打分 | ||
4. 内存占用:SG2002 上总共有 256MByte 的内存,需要在这个内存限制下实现 ASR 功能。 | ||
5. 实时率:模型需要支持实时流式识别,即 RTF<1,RTF 越低越优秀 | ||
6. 错误率:模型在上述限制下需要实现优秀的 WER,WER 至少要在 10% 以内才能实现基础的实用性,最好在 5% 以内 | ||
7. 最终,组委会将根据参赛作品的正确性和性能的综合表现进行评分,两者将按照赛题评审委员会设定的加权比例计算出最终得分,得分最高的参赛者将获得胜利 | ||
1. SG2002のオンボードマイクを使用してリアルタイムオフライン音声認識を行います。 | ||
2. 参加者は、RVV0.7、TPU、またはSG2002上の他の利用可能な計算リソースを使用して計算を行うことができます。 | ||
3. 審査基準は、メモリの使用量、リアルタイム性、誤り率の3つの指標に基づいて総合的に評価されます。 | ||
4. メモリ使用量:SG2002には合計で256Mバイトのメモリがあり、このメモリ制限内でASR機能を実現する必要があります。 | ||
5. リアルタイム性:モデルはリアルタイムストリーミング認識をサポートする必要があり、即ちRTF<1、RTFは低いほど良い。 | ||
6. 誤り率:上記の制限下でモデルは優れたWERを実現する必要があり、WERは少なくとも10%以下で基本的な実用性を実現し、できれば5%以下が望ましい。 | ||
7. 最終的に、組織委員会は参加作品の正確性と性能の総合的な表現に基づいて評価を行い、これらはコンテスト審査委員会が設定した加重比率に基づいて最終得点が計算されます。得点が最も高い参加者が勝利を収めます。 | ||
|
||
**验证平台:LicheeRV Nano/Milk-V duo 256** [^1] | ||
**検証プラットフォーム:LicheeRV Nano/Milk-V duo 256** [^1] | ||
|
||
## 知识产权及开源协议说明 | ||
## 知的財産権およびオープンソースライセンスに関する説明: | ||
|
||
所有参赛结果要求开源,并提交至主办方指定仓库。参赛者(作者)持有作品的所有权。主办方鼓励参赛者将结果回馈贡献至 upstream。 | ||
すべての参加成果はオープンソースとして公開し、主催者が指定するリポジトリに提出する必要があります。参加者(著者)は作品の全ての権利を保有します。主催者は、参加者が成果をアップストリームにフィードバックして貢献することを奨励します。 | ||
|
||
|
||
[^1]: LicheeRV Nano/Milk-V duo 256 购买链接: | ||
[^1]: LicheeRV Nano/Milk-V duo 256 購入リンク: | ||
- LicheeRV Nano: https://sipeed.com/licheerv-nano | ||
- Milk-V duo 256: https://milkv.io/duo (请选择 256M 版本) | ||
- Milk-V duo 256: https://milkv.io/duo (256Mバージョンを選択してください) |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
|
@@ -2,13 +2,11 @@ | |
title = 'チャレンジ' | ||
+++ | ||
|
||
すべての結果は、以下のRISC-Vハードウェア環境の少なくとも1つで検証する必要があります: | ||
チャレンジ S2312 は SG2002 での確認が必要ですが、その他の赛题のすべての提出結果は、以下のRISC-Vハードウェア環境で検証する必要があります。各課題では少なくとも1つを指定します: | ||
|
||
- SG2042/Pioneer Box(SG2042と略) | ||
- CV1800B/Milk-V Duo(Duoと略) | ||
|
||
(excludes challenge S2312, which should be verified on SG2002) | ||
|
||
[詳細はこちら](/ja/introduction/) | ||
|
||
気楽にメールでスタッフまでにご連絡ください。: [[email protected]](mailto:[email protected]) |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters