研究情報

人間がどのように音声を処理し,何を手掛かりに複雑な情報を認識しているのか,未だ全容は解明されていません.本研究では,音声信号処理に医学的アプローチを統合することで,計算機による人間の聴覚と等価な音声処理を目標としています.

音声を創る

音声や歌声の合成技術は,エンタテインメント分野を中心に広く利用されるようになりました.本領域では,世界最高峰の品質での音声合成を達成可能な技術を武器に,「高齢者に聞き取りやすい声」「人間と機械音声の中間声」「男性・女性の音声モーフィング」「歌声における歌唱力補正」等の音声合成技術を,実用に耐えうる品質で実現するための研究を推進しています.
最新の研究成果となる音声分析合成システムWORLDは下記サイトからダウンロード可能です

音声分析合成システム「WORLD」

パラメタを独立に操作し再合成 –合成音声の品質は現存の方法中最高

音声を創る
二人の声を任意の比率で混ぜ合わせ
音声を創る

音声を知る

スマートホンの普及に伴い音声による入力が一般にも認知されるようになりました.一方,未だ「音声の人間らしさ」「会話中から感じる繊細な態度」等音声の「表情」を理解することは極めて困難です.本領域では,人間がどのような情報を手掛かりに音声に含まれる様々な情報を処理しているのかについて,感性情報処理,音声分析技術の側面から研究します.

計算機を人間に近づけたい –人間と同様に言語・言語以外の情報を処理

音声を知る

音声を聴く

人間は音の波形を聴覚末梢系・中枢系でパルス列に変換した多チャネルの信号を処理しています.人間の脳と等価な音声処理を実現するためには,波形だけではなく中枢神経系での処理を模擬することが重要と考えています.本領域では,医学的アプローチとして一次聴覚野の生理データを計測し,音声処理に利用するアプローチで研究を進めます.

計算機を人間に近づけたい –人間と同様に言語・言語以外の情報を処理

音声を知る

Page Top

twitter