検索
特集

NotebookLMからフルカスタムまで Google CloudでRAGを構築する方法を徹底解説RAG構築術 Google Cloud編

LLMの精度を高める「RAG」をGoogle Cloudで実装するには。無料ツールから本格的な開発まで、レベルに応じた4つのパターンを網羅的に解説する。自社に最適な手法を探す上で参考にしてほしい。

PC用表示 関連情報
Share
Tweet
LINE
Hatena

 外部情報の検索機能を大規模言語モデル(LLM)に組み合わせる手法、「RAG」(Retrieval-Augmented Generation=検索拡張生成)を大手クラウドサービスで実装する方法を網羅的に解説する本特集。第2回は「Google Cloud」編をお届けする。

  • 第1回:Microsoft編
  • 第2回:Google Cloud編(本稿)
  • 第3回:AWS編(2025年9月1日公開予定)

NotebookLMからフルカスタムまで RAG構築パターン4選

最も手軽なのは「NotebookLM」

 Googleが提供する広義のRAGサービスとして「NotebookLM」が挙げられる。PDFやテキストファイル、音声、動画、Webページ、「Google ドキュメント」のファイル、「YouTube」の動画など、さまざまな資料を基に、それらの情報を要約したり抽出したりできるツールだ。無料で使用を開始でき、個人利用では「Google AI Pro」「Google AI Ultra」プランに加入すれば読み込ませるソースの量や作成できるノートブックの上限が増加する。企業利用では「Google Workspace」の「Business Standard」以上のプランでそれらの上限が増加する。


NotebookLMの利用イメージ。左ペインにデータソースを追加すると、中央のチャット画面でその内容に基づいたやりとりを実行できる。右ペインで音声解説や動画解説の出力も可能(出典:筆者撮影)

 グーグル・クラウド・ジャパンの下田倫大氏(テクノロジー部門 事業開発部長《機械学習/AI》)は「NotebookLMはRAGを実現するための仕組みを提供するのではなく、パッケージとしての製品体験を提供している」と説明し「調べたいファイルが決まっている場合に適している」とした。

 しかし、調べる対象が分からない場合は大量のデータソースから情報を検索する機能が必要になる。その場合はGoogle Cloudの各種サービスを使ってRAGを構築する必要がある。

社内のRAG構築、スタート地点は「Google Agentspace」

 社内の情報に基づいた回答をするチャットbotやAIエージェントを構築したいなら「Google Agentspace」が便利だ。これは2024年末にGoogle Cloudが提供を開始した企業向けのAIエージェントプラットフォームだ。社内のドキュメントやメール、チャットなどを横断的に検索する機能がデフォルトで実装されており、難しい構築作業抜きでRAG相当の機能が使用できる。

 「アプリ」というエージェントと、使用するデータをまとめた「データストア」を用意し、Google Agentspaceでそのアプリを利用すると、データストアの情報に基づいた回答やアクションを実行してくれる。


Google Agentspaceの全体像(出典:Google CloudのWebサイト)

 データストアの対象には「BigQuery」と「Cloud Storage」に加えて、Google Workspaceの「Google ドライブ」や「Gmail」、「Microsoft OneDrive」や「Microsoft SharePoint」「Slack」などのサードパーティーのソースも選べる。

 Google Agentspaceは難しい権限管理もある程度簡単に済ませられる機能を持っている。また、ユーザーが生成AIに求めるニーズが単なる情報取得から「アクション」に移っており、これら2点の理由からGoogle Agentspaceが「RAG導入の実質的なスタートライン」(下田氏)になることも多いという。

 キーマンズネットの読者調査でも「興味がある生成AI関連技術」として「RAG」(47.7%)を抜いて「AIエージェント」(59.1%)が1位だった。ユーザーは単なる検索エンジンではなく自分の代わりに働いてくれる存在を求めており、Google Agentspaceのような簡単にエージェントを構築するサービスは今後利用が広がるだろう。


Google Agentspaceで複数のエージェントが連携してアイデアを考案する様子(出典:Google CloudのWebサイト)

 Google Agentspaceの利用にはユーザーごとのライセンス契約が必要だ。本稿執筆時点では1ライセンスにつき月額25ドルから利用可能となっている。詳細はGoogle CloudのWebサイトで確認後、営業担当者に問い合わせてほしい。

RAGに必要な機能をフルマネージドで提供する「Vertex AI Search」

 第1回で取り上げたMicrosoftはRAGのプロセスを(1)ユーザーが入力したクエリに応答するために必要な情報を取得するプロセス(Retrieve)と、(2)取得した情報をプロンプトに付加(Augment)してLLMの外部知識として入力し、LLMに応答を生成(Generation)させるプロセスに分けて解釈し、それらに対応したサービスを提供していた。

 Google CloudもRAGのプロセス全体を支援するサービスを提供していることに変わりないが、プロセスの分類法が異なる。同社はRAGのプロセスを(1)データソースへ接続し整理するプロセス(Indexing)、(2)ユーザーが入力したクエリに応じた情報を検索するプロセス(Retrieval)、(3)LLMが回答を生成するプロセス(Generation)に分ける。Microsoftがユーザーのクエリ起点でプロセスを整理するのに対して、Google Cloudはインデックス生成を起点に捉えている。世界中の膨大な情報を収集し、整理、構造化して巨大な索引(Index)を作成するGoogleならではの解釈にも見える。

 このプロセス全体をフルマネージドサービスとして支援するのが「Vertex AI Search」だ。データの取得から検索、生成までを1つの管理画面で実行でき、応答精度の確認までであればこの管理画面で完結する。管理画面でプレビューできるチャット画面をウィジェットとしてアプリケーションに組み込むことも可能だ。エージェント機能ではなく、純粋にRAGの機能だけを求めるのであれば、まず使いたいサービスだ。


Vertex AI Searchの機能一覧(出典:Google Cloudの提供資料)

 フルマネージドとはいえ、NotebookLMやGoogle Agentspaceと比べると利用の難易度は上がる。下田氏は「『検索に対するスペシャリスト等が必要にならない』という点で、AIや検索の深い知見がなくても実用的なレベルのRAGを提供可能」とした一方で「現実としてVertex AI Searchをエンジニア無しで使っているお客さまはあまりいない」と注釈した。本格的に利用するとなると、権限管理や既存のアプリケーションとの連携など考慮すべき課題も多くなるからだ。アプリケーション開発のエンジニアが在籍している企業であれば、内製でRAGを構築する事例もあるという。

フルカスタムしたい場合は「Vertex AI RAG Engine」とカスタムAPI

 RAGの各プロセスをさらに細かくチューニングしたい場合は、Vertex AI Searchの各機能を切り出したAPIや、それらを統合したフレームワークとして提供する「Vertex AI RAG Engine」を利用すればいい。文書からデータを抽出する「Document AI」、抽出したデータをベクトルに変換する「Vertex AI Embeddings」、ベクトル検索を実行する「Vertex AI Vector Search」、検索結果をクエリとの関連性が高い順に並び替える「Ranking API」、Geminiよる応答を生成する「Gemini API」などが含まれる。ベクトルデータベースやインフラなど、サードパーティーのサービスを組み合わせたい場合は検討してほしい。


Vertex AI RAG Engineの機能一覧(出典:Google Cloudの提供資料)

 Google CloudでRAGを構築する強みについて下田氏は、Googleが創業以来、検索技術を磨き続けてきた企業であり、そのDNAが各サービスに組み込まれていることを挙げた。本特集で取り上げたクラウドサービスの中では市場シェアが最も少ないが、業界、業種問わず導入が進んでいるという。Google WorkspaceやBigQueryなどを業務の基盤に据えている企業が増えており、Googleが提供する基盤にデータが貯まっていることも関係しているだろう。

導入時の注意点

 実際にRAGを構築するに当たって、Google Cloudのパートナー企業の力を借りることもあるだろう。どのようなパートナーを選ぶのが適切なのだろうか。下田氏は「導入の目的によって方針が異なる」と説明する。RAGのユースケースがはっきりと言語化できていないのであれば、コンサルティングに強いベンダーに相談して、自社のどの業務に効率化の余地があるのか見極めるところから始めたい。既にユースケースが決まっているのであれば、Google CloudでのRAG構築事例が豊富なベンダーに技術的な支援を求めるのが良いだろう。

 その他、導入時の注意点について下田氏は権限管理の重要性を強調した。RAGを利用したシステムにおいて最も大きなリスクの一つが「見せてはいけない情報をユーザーに回答してしまう」という事象だ。これを防ぐにはユーザーの権限に応じてアクセスできるデータを制限する必要がある。

 先述したように、Google Agentspaceの権限管理はシンプルだ。データソースを同期する際に、アクセスコントロールリスト(ACL)というアクセス権限の情報も同期する。あらかじめデータソースごとに適切なアクセス権限を設定しておけば、Google Agentspaceでもユーザーの権限に応じた情報のみ参照される。個別に複雑な設定をせずに権限管理ができるため、IT担当者目線でもGoogle AgentspaceがRAG導入のスタート地点になるケースも多いだろう。

 本稿では、NotebookLMからGoogle Cloudの各種サービスまで、Google製品でのRAG構築法を解説した。「特定のデータソースに沿って回答するAIチャット」を使いたい場合はまずNotebookLMを使い、より広範な社内データを基に回答させる必要があるならGoogle Agentspaceを始めとしたGoogle Cloudのサービスを利用してほしい。

 次回、第3回(最終回)ではAWSでのRAG構築法を解説する。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る