メディア

失った声を音声合成で取り戻す「ボイスバンク」とは?5分で分かる最新キーワード解説(3/4 ページ)

» 2015年09月02日 10時00分 公開
[土肥正弘ドキュメント工房]

英国の大学での実証実験とALS患者への適用

 山岸准教授はもともと徳田教授の共同研究チームの一員で、主に数理的な興味から研究に携わっていた。2008年ごろに、この技術を福祉領域に使えるのではないかと考えた英国シェフィールド大学の研究者とともに、喉頭摘出して発声ができない人と、パーキンソン病を患う人に、健常時の本人の声を再現するプロジェクトを開始した。

 喉頭摘出者の場合は手術前に100文章ほどの音声(10分未満)の音声収録が可能だったため、それまでに作成済みだった平均声のモデルに本人の声のパラメータを加えることができた。パーキンソン病患者の場合は既に構音障害が出ていたが、抑揚や話速(タイミング・加速度)などを平均声と比較して、不自然なところを修正しながら調整した。その結果、どちらも良好な結果を得た。

 こうした研究成果が出たのが2009年ごろのこと。ある日、この研究を知った英エジンバラ大学の脳科学研究者が、突然山岸准教授の研究室を尋ねてきた。その研究者はALSの研究を進めていて、パーキンソン病患者に適用できる技術なら、同じように進行性の脳の病気であるALSの患者にも適用できるのではないかと共同研究を提案し、2人のALS患者を紹介した。山岸准教授の研究チームはこれに賛同し、早速ALS患者への適用実験が始まった。

 患者の1人はスコットランド在住で、地域独特の訛りや方言がある人だったため、一般的な英国人の平均声が適用できなかった。本人は幸いその当時は発語に問題なかったため、平均声の作成には自宅付近の20人ほどのボランティアに協力を依頼して、地域性を反映した平均声を作成、本人の声で補正したところ、本人が満足ゆく結果になるとともに奥さんからは「本人らしい力強い声」だという評価を得ることができた。

 もう1人の患者は、兄弟の協力を得て平均声を作成、本人の声へ変換を行った。さらに、収録時に既に構音障害が出ていたため、兄弟の発音と比較し障害を補正し、本人に近い声の再現を行った。こちらは両親から「本人の特徴がちゃんと出ている」という評価がもらえた。

 これらの結果に勇気付けられて、もっと大規模に実証実験をしようと考えるのは自然な成り行きだった。山岸准教授がALS研究者とともに、2011年ごろから始めた活動が「ボイスバンク」だ。

 より多くの患者に音声合成システムを提供するには、ベースになる平均声も多数必要になる。そこでボランティアを呼びかけ、声の収集活動を開始した。現時点では、英国では約900人の健常者の声が集められ、ALS患者70人程度の声も収集できた。患者全員分の声の関数が出来上がり、10人強ほどの患者が音声合成システムを試用する。

 国内でのボイスバンクプロジェクトは、山岸准教授が帰国して現職に就任した翌年の2014年からスタートし、これまでのところ800人ほどのボランティアの声を収録し、障害者の声も収録も一部が収録されたところだ。

 健常者の声は実証実験には十分な量があり、今後はさらに障害者の協力を求めていく予定だ。国内の障害者への音声合成システム適用は始まったばかりだが、実証実験が成功すれば、次は本格的な実用に向けた取り組みが開始されるだろう。

Copyright © ITmedia, Inc. All Rights Reserved.

会員登録(無料)

製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。