AIを活用したデータ分析が当たり前になりつつある今、その回答精度の向上にはデータのメタデータ整備が重要だ。AIを活用して効率的にメタデータを整備できればさまざまな効果が見込める。
AIを活用したデータ分析が当たり前になりつつある今、その回答精度の向上にはデータのメタデータ整備が重要だ。
三井物産グループ・MBKデジタルの岩尾一優氏(CTO《最高技術責任者》)は、AIとの対話を成功させるためのポイントとして3要素を挙げる。「基盤モデルの性能が一定以上であること」「プロンプトを生成する技術」「AIが理解できるメタデータの整備」だ。
「AIの導入が盛んになり、プロンプトの整備に慣れてきた組織は決して少なくありません。そのため現在はAIが理解できる形でのメタデータの整備が特に重要です。『プライス』や『セールス』といったカラムがあった場合、それが円なのかドルなのか、税込なのか税別なのかという細かい点まで整備しないと、AIによる回答を理想に近づけられません」(岩尾氏)
これまでメタデータは人間向けに検索性を向上させるために使われてきた。今後はSQLの生成やデータ分析の自動化のために使われるようになるだろう。
メタデータの重要性を理解している組織は組織は多いものの整備には課題が残る。整備技術を持つエンジニアは主業務に追われてメタデータの整備が後回しになり、メインユーザーとなるビジネスメンバーは整備の手段に明るくないケースもある。結果として、メタデータの整備という業務が浮いた状態になるのだ。岩尾氏はビジネスメンバーが主役になり、簡単で効率的なメタデータ整備プロセスの導入を提案した。
岩尾氏によると、メタデータ整備のプロセスは3段階だという。
はじめに、よく使うテーブルに優先順位を付けることだ。各テーブルの参照回数を確認して、優先的にメタデータを付与することにする。
次に、AIでメタデータのたたき台を作り、人間のレビューで精度を高める作業に移る。ゼロから人の手で生成する際と比較して作業を効率化できるが、生成されたメタデータは人の手で必ずレビューした方がいい。MBKデジタルはGoogleの「Gemini」を採用した。
最後に、「BigQuery」を使う場合だが、完成したメタデータをBigQueryのディスクリプションに書き戻す。岩尾氏は、既存のテーブルのスキーマを変更するSQLコマンド「ALTER TABLE」を使う方法を説明した。
従来、データ探索やSQL実装は専門家にとっても大きなボトルネックだった。しかし、メタデータを整備することで、生成AIでSQL文を作成する際に、AIが適切なデータをピックアップしやすくなる。例えば、「人気商品をピックアップして」と指示を出した場合、AIが「人気とは、売上の金額が大きいことだろう」と考えた上でSQLを生成してくれるようになる。
岩尾氏によると、メタデータの整備でAIが曖昧なカラムを解釈できるようになる効果も大きいという。
「データ探索やSQL実装の効率が大幅に向上します。メタデータの整備は単なる作法でなく、AIの能力を最大限に引き出す投資です」(岩尾氏)
Copyright © ITmedia, Inc. All Rights Reserved.
製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。