「生成AI時代のデータ管理」は今までと何が違う? 注意点を解説:事例で学ぶAI活用とデータ基盤
生成AIの活用は顧客サービスの向上や業務効率化に貢献する。それを支えるデータ基盤にはどのような性質が求められるのか。Clouderaの大澤毅社長が解説する。
事例で学ぶAI活用とデータ基盤
生成AIの活用で成果を上げる企業が増えている。データの適切な収集、管理、分析は業務効率化やDX(デジタルトランスフォーメーション)、競争力の強化をもたらす。本連載では、事例を通してデータ活用がもたらすメリット、デメリットを具体的な事例を通して紹介する。
ITシステムやデータ環境の複雑化でデータ統合が課題になっている。生成AIをはじめとする新技術の登場もあり、オンプレミス環境やIaaS、SaaSなどに点在するデータを効果的に活用するためにはインフラ整備が必要です。
変化を続ける市場において、企業がデータの価値を最大限に引き出すには、オンプレミスとクラウドの両方に対応した環境構築が重要です。Clouderaが2024年4月に発表したグローバル調査結果レポート「Data Architecture and Strategy in the AI Era(AI 時代のデータアーキテクチャと戦略)」では、回答者の93%が「企業が変化に対応するにはデータおよびアナリティクスの環境がマルチクラウドやハイブリッドクラウドであることが重要だ」と答えています。
ハイブリッド環境を構築すれば、複数のプラットフォームに散らばったデータの収集や管理、分析を効率化できます。新技術に対応するためには既存のITシステムと生成AIなどをシームレスに統合できる仕組み作りも必要不可欠です。
大企業にとってはガバナンス管理も手を抜けません。信頼性が高く安全で適切に統治されたAI環境を構築するための基盤整備は、競争力を維持するには急務です。
生成AI活用はコスト削減、顧客体験向上、時間の有効活用に
生成AIは企業独自のデータ環境を整備することでその真価を発揮します。チャットbotや自動レポート生成といった機能を導入することでビジネスオペレーションに大きな変革をもたらす可能性を秘めています。
AIチャットbotは顧客サービスの向上に大きく貢献します。顧客の好みや行動パターンに合わせたパーソナライズをし、人間が激しい違和感を覚えない品質のコミュニケーションを24時間365日にわたり素早く提供できれば、顧客満足度の向上と人件費の抑制につながります。
生成AIは業務効率化にも大きく貢献します。作業ミスの軽減やレポートの自動生成で従業員の負担を軽減し、生まれた時間的余裕をイノベーションにつながる新たな活動に投資できるようになります。
では、そんな生成AIを最大限活用するためにはどんなデータ基盤を構築すればいいのでしょうか。
生成AI利用におけるデータ管理の注意点
生成AIは企業の競争力強化に寄与するといえるでしょう。データ環境の整備と生成AIの導入は、これからのビジネス成功の鍵を握っていると言っても過言ではありません。
画像や動画などの非構造化データからも価値を引き出せるようになった一方、データのプライバシーや整合性、バイアスのリスクなどセキュリティとガバナンスに関する懸念が存在します。
企業が競争力向上を目指すなら、自社のオリジナルデータにアクセスできる環境が不可欠です。しかし、これらのデータには機密情報も含まれるため適切なデータ管理と統制が求められます。
出力結果も、虚偽や不正確な内容、著作権法違反、差別的な表現などは避けなければいけません。しかし多くの組織はデータ管理のノウハウを十分に持っておらず、保守的なアプローチを選択しがちで、技術を効果的に活用できない状況に陥ることがあります。
データガバナンスという言葉には、責任のあるデータ取り扱いのための明確なポリシーの確率や定期的な従業員教育、リスク評価、セキュリティ対策の優先順位付けなどが含まれます。利害関係者との信頼構築のためには、透明性や説明可能性の確保と、適切な同意確認、定期的な監査が求められます。
これに対応できるデータ基盤の整備にはプライバシーと安全性を考慮した新しいプロセス設計が必要です。企業は生成AIの恩恵を享受するためにデータ管理の課題にも真正面から取り組まなければなりません。
ハイブリッドアーキテクチャへの移行
企業が自社のデータを生成AIに学習させる場合、外部サービスとデータを共有することなく、適切なコンテキストで専有基盤内で管理することで誤情報や文脈ミスの出力を大幅に減らせます。
大規模で貴重なデータを管理している場合は、相互運用性と柔軟性に対応できるオープン性が必要です。データプライバシーや誤情報生成の問題は、社内に閉じた環境とモデルの仕様で対処できますが、高い開発運用コストが伴います。外部のサービスを使用すると、正確性の低下や情報が漏えいする恐れがあります。
この問題の解決策の一つとして、オープンソースの大規模言語モデル(LLM)を使う方法があります。企業は開発運用コストを抑えながら安全性とオープン性を確保できます。
以前は「クラウドファースト」としてパブリッククラウド環境へのシフトが盛んでしたが、近年は慎重なクラウド戦略をとる企業がみられます。その背景には、予測可能な分析ワークロードの経済性やデータ管理規制、組織の財政方針などの要因があるようです。クラウドベンダーのサービスに依存することをリスクと考える組織も増えています。
これらの企業はパブリッククラウドとオンプレミス環境やプライベートクラウドの両方にまたがるアーキテクチャを採用しています。非常に複雑ですが、柔軟性や拡張性、コスト削減などのメリットがあります。
業界を超えて学べるベストプラクティス
今回はDX推進における生成AIとデータ基盤の役割、多くの企業が直面する課題について説明しました。生成AIは顧客サービス向上や業務効率化に貢献する一方、データのプライバシーや整合性、生成物のバイアスなど倫理とセキュリティに配慮した適切なガバナンスとプロセスの設計が不可欠です。
また、データ活用における柔軟性や拡張性、安全性の向上を目指し、ハイブリッドなクラウドネイティブアーキテクチャを採用する企業が増加していることにも触れました。
本連載では今後、さまざまな業界での事例を参考にデータ活用の在り方を探ります。業界に特化した事例であっても、ベストプラクティスや課題解決のヒントは、業界を問わず広く応用できるものと考えています。本連載が、皆さまのビジネスにおけるデータ活用の一助となれば幸いです。
著者紹介 大澤 毅(おおさわ たけし)Cloudera株式会社 社長執行役員
IT業界を中心に大手独立系メーカーや大手システムインテグレーター、外資系IT企業のマネジメントや数々の新規事業の立ち上げに携わり、20年以上の豊富な経験と実績を持つ。Cloudera入社以前は、SAPジャパン SAP Fieldglass事業本部長として、製品のローカル化や事業開発、マーケティング、営業、パートナー戦略、コンサルティング、サポートなど数多くのマネジメントを担当。2020年10月にClouderaの社長執行役員に就任。
Copyright © ITmedia, Inc. All Rights Reserved.