自動翻訳が難しい日本語。AIを活用した機械学習による多言語コミュニケーションの実現に向けたプロジェクトが動き出した。
豊橋技術科学大学、日本マイクロソフト、ブロードバンドタワーは3者共同で、それぞれの技術を持ち寄り、AIならびに機械学習による多言語コミュニケーションの実現に向けて協業を開始すると発表した。
日本マイクロソフトはAzureベースのデータ分析環境を提供する。ブロードバンドタワーはIoT基盤サービスの他、事業構築に向けて、新会社エーアイスクエアを設立する(連結子会社)。
具体的には、自然言語処理を専門とする豊橋技術科学大学の伊佐原均教授のもとで、日本語の「対訳コーパスデータベース」を構築・整備し、高度な機械翻訳サービスを2020年までに実現することを目指す。
伊佐原教授らによると、日本語は自動翻訳が難しい言語であるため、汎用(はんよう)的な翻訳ではなく、分野ごとの重要語句の抽出と辞書化によって翻訳エンジンの性能を高める必要があるという。具体的には、医療や観光などの分野に絞り込んで辞書を参照することで、文脈に合致した翻訳に近づけるもの。重要語句の抽出と専用辞書データベースの参照が必要だ。
伊佐原教授らは、この専用辞書データベースの元となるデータを、サービス利用者らと連携することで効率よく収集して整備していくもくろみだ。既に幾つかの自治体と協力に向けて話を勧めているところだという。
マイクロソフトはMicrosoft Azure上で機械学習サービス「Azure Machine Learning(Azure ML)」を展開している。また、この機械学習エンジンを利用した「Cognitive Services」として、画像認識や音声認識、テキスト読み上げ、テキスト解析などの機能をAPIとして提供している。さらに、Azure ML上で構築したサービスをマイクロサービスとしてデプロイし、マーケットプレースで提供するための基盤も持っている。サービス自体は50種類の言語に対応している。
「日本語から英語への翻訳精度が十分になれば、他の言語への展開は容易。この仕組みが実現すれば、例えば訪日外国人観光客の対応などで、国内の自治体やサービス事業者らの負担を軽減できると考える」(ブロードバンドタワー代表取締役会長兼社長 藤原洋氏)
ブロードバンドタワーでは、主に2015年に発足した新会社エーアイスクエアでAI・機械学習を活用した事業構築を推進するとしている。
なお、これとは別に文部科学省では、理化学研究所内に「革新知能統合研究センター」を設立しており、また、産業技術総合研究所や情報通信研究機構を中心に複数の省庁横断型の研究枠組みを立ち上げている。今回の3者の取り組みについて、同省では「効果的な連携が実現できることにも期待」するとのエンドースメントを添えている。
伊佐原教授は、3者の成果物となる対訳コーパスデータベースについて、「研究機関としては広く利用者に開放できるように整備していきたい」とコメントしている。
Copyright © ITmedia, Inc. All Rights Reserved.
製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。