「GPT-4o」でIT製品やサービスはどう便利になる? ベンダー各社の動き
付加価値の提供やサービス向上のために、ユーザー企業のみならず、IT製品ベンダーも生成AIの活用や製品への実装を進めている。早くも、OpenAIの最新言語モデル「GPT-4o」を実装したサービスが幾つか発表された。
OpenAIが2024年5月に発表した最新言語モデル「GPT-4o」は正確性や生成速度が向上したばかりではなく、テキストや画像に加えて音声や動画データも処理が可能になった。GPT-4の後に「全て」を意味する「omni」(オムニ)を略した「o」が付けられているのはそのためだ。
これに合わせてITベンダーは、付加価値の提供やサービス向上のためにGPT-4oを実装しようと取り組みを進めている。本稿では、GPT-4o実装に向けた、ITベンダー各社の動向をまとめて紹介する。
「GPT-4o×AI-OCR」で入力作業工数を削減
マネーフォワードは、「マネーフォワード クラウド契約」にGPT-4oを実装した「AI自動入力機能」の提供を開始した。
AI自動入力機能は、PDF形式の契約書ファイルをマネーフォワード クラウド契約にアップロードすると、契約書の種類や項目名などをAI-OCRが読み取り、情報を自動的に入力する機能だ。過去に紙の書面で締結した契約書もスキャンしてアップロードすることで電子管理が可能になり、契約書を一元管理できる。
2024年5月にβ版をリリースし、一部ユーザーに対して先行して提供していたAI自動入力機能が全ユーザーで利用可能になった。GPT-4oが標準実装されたAI-OCRの機能を追加課金なしで利用できる。今後、締結手続き中の契約書の自動入力や、複数契約書の一括自動入力、また台帳作成以外にも生成AIを活用した機能追加も予定しているという。
なお、AI自動入力機能にはMicrosoftの「Azure OpenAI Service」が使われている。読み取った情報が提供元を含む第三者機関に保管されたり、入力したデータが学習に使用されたりすることはないという。
Box AIにGPT-4oの実装を計画中
クラウドストレージベンダーのBoxは、「Box AI」にGPT-4oの実装を計画中だ。
「Box Hubs」でより質の高い回答を生成し、20を超える言語に対応するための機能を提供する。また、対応ファイル形式も追加する。画像ファイルにおいて自然言語でのクエリをサポートすることで、Boxに保存されている画像ファイルに関して具体的な質問を投げかけることができる。スプレッドシートのクエリを実行可能なコマンドに変換することで正確なデータ分析が可能になる。
また、「Box AI for Metadata API」を使用することでカスタムアプリケーションとBox AIとの統合が可能になり、ドキュメントから重要な情報を自動的に抽出できる。Boxのワークフロー自動化ツールと組み合わせることで、ファイルのメタデータに基づいてプロセスを自動化し、非構造化コンテンツから重要なフィールドを抽出し、「Salesforce」などの外部アプリケーションに情報を保存できる。
このように、ユーザー企業のみならずITベンダーも自社製品やサービスの向上を目的に生成AIの活用を進めているところだ。今後も多くの製品やサービスなどでGPT-4oの活用が進むことが予想される。製品やサービス利用に当たって、こうした最新の情報を収集しながら比較検討を進めたいところだ。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- OpenAIの最新モデル「GPT-4o」で何ができる? ChatGPTの強化ポイント
OpenAIはChatGPTの有償ユーザー向けに、GoogleやMicrosoftの標準的な形式で表されたデータをより扱いやすくする「GPT-4o」を発表した。 - 電通デジタル、自社サービスにGPT-4o、Gemini、Claude 3の最新モデルを実装
自社サービスやアプリケーションに生成AIを組み込む動きが本格化してきた。電通デジタルも、最新の言語モデルの実装に踏み切った。 - これから始める「Microsoft Copilot」 使って分かった有効活用法と注意点
OpenAIの大規模言語モデルが「GPT-4o」へと進化し、Microsoftの「Copilot」、Googleの「Gemini」などを業務で活用しようとする動きが活発化している。今後は生成AIをどうビジネスや業務に活用するかが問われる時代になるだろう。