NTT、複数の人の会話を発信者ごとに聞き分けて書き起こすことができるAIを開発 会議の議事録をリアルタイムで作成可能に

NTT

NTTグループは独自のAI技術を「corevo(コレボ)」と総称し開発に力を入れている。今回の音声認識技術について「世界一の水準」と自負しており、議事録の即時作成のほか、雑踏の中でも対応できる通訳システムや音声で操作する家電店舗窓口での客とのやり取りの記録などさまざまな分野への応用が考えられる。担当者は「すでに実用化に近いレベルにある。1、2年後には世に出したい」と話している。

1:
NTTは、大きな雑音の中でも必要な音声を認識して正確に書き起こすことができる人工知能(AI)技術を開発した。複数の人の会話を発言者ごとに聞き分けることも可能で、&

2:
そういうことは渡部恒三氏の発言を漏れなく起こせるようになったら言ってくれ。

3:
聖徳太子みたいなもんか

4:
やったね仕事(雇用)が減るよ。

7:
>>4
仕事が減るってことは、あなたは要らないってことだよ。
よく考えてね。

5:
なんだ、IBMのまた真似か。
音声認知と出力は、携帯でもできる話じゃないか。
言語間の翻訳は、誤訳が多いけれど、既に確立された技術じゃないか。
何が新しいのか? AIをかますと、誤訳が多くなるんじゃないの?

6:
AI必要なん?

8:
国会の野次もしっかり記録やね

9:
多言語、多方言でもいける?

10:
>>複数の人の会話を発信者ごとに
>>複数の人の会話を発言者ごとに
NTTの場合、まったく意味が異なるんだけど

11:
>NTTは、音の大きさや方向などから認識すべき音声と雑音を自動的に推定し高精度で識別するアルゴリズム(手順)を開発。
アルゴリズムであって学習ではないな。

12:
双子がハモりながらたまに違うことしゃべるとどうなんだろう

13:
議事録って言うか速記録じゃ?

14:
問題は似た発話者をどうやって区別するかだろう、
それは同一発話者を多重に重ねて区別できるかってことだよ

15:
ボイスメモから議事録作るとき今の誰の発言?ってのがよくあるから精度が高いなら助かるかも。
つーか議事録要員自体がいらなくなるのか。

16:
一万円と五千円札を聖徳太子に戻して対中牽制
千円札を伊藤博文公に戻して対韓牽制
というのはどやろw

17:
たくさんの聞き上手な人がなんどきいても発言内容が区別できないような
ものを区別するのは無理だろう、それを区別できるのはマイクで音声を
拾う段階で音の発信源単位の音声に分離すること。
マトリクスで構成された多数の3Dマイクロホンで位相を逆解析すれば
できないことじゃない。

18:
ここで、欧米式の人は機械に合わせろ、と
日本式の人に機械に合わせる、分かれて
過剰品質高コストへ
いや、モノは良けれど採算と汎用性に難あり

20:
都合の悪いところは自動的に無音になる
テレビ会議システムはかなわないな
とうてい

21:
>6人程度のやり取りを聞き分けることができる。
まだ愛称に聖徳太子という名前は付けられないな

22:
人件費にした方が有意義だね

23:
そんなもん開発するなら、迷惑電話シャットアウトできるものを開発しろ

24:
国会議事録に採用しよう。
用途はヤジを分析して、誰がやじったか分析記録する。

25:
すばらしいねー
誤変換ばかりのIMEの代わりが欲しいよ

26:
「そこまで言って委員会」「TVタックル」の発言録づくりの実験をぜひ

27:
天龍源一郎と長州力と前田日明と本間智朋晃と藤波辰爾が同時に喋って解析できたら認めてやる

28:
そういや星新一のショートショートで神様になって消えてしまうっていうのがあったな。

29:
これは悪くないね

30:
ターゲットとなる音声の特性を認識してピックアップするだけでしょ??

31:
音声認識だけでできてるのかな?
記事読むとそんな気がするがマイクでの方向検知も組み合わせて精度上げでもって会議では有効そう。
一人だけの認識でも雑音内での認識が飛躍的に上がれば素晴らしく使い物になる。
こういった技術は頑張ってほしい。

32:
マイク一つでやってたら凄い

引用元: ・【人工知能】NTT、複数の人の会話を発信者ごとに聞き分けて書き起こすことができるAIを開発 会議の議事録をリアルタイムで作成可能に

まる くん
仕事が減るってことは、あなたは要らないってことだよww
なな さん
ターゲットとなる音声の特性を認識してピックアップするだけでしょ!!
スポンサーリンク
ピックアップ記事
8888: ピックアップ 2008/08/08

シェアする

フォローする