Google Cloud Next 24 参加レポート

こんにちは、U-NEXT HOLDINGS社内生成AIアプリケーション”Buddy”開発チームの高見(関西出身)です。8/1、 8/2 に開催された Google Cloud Next 24 へチームメンバーで参加してきました。Google Cloud Next 24 では Google Cloud の最新リリースや利用についての事例をセッションとして聞くことができました。

本稿では以下 2 点をご紹介します。

  • 初学者向け「 Google Cloud 生成AIで利用可能なツールの概要」

  • Google Cloud Next の簡易イベントレポート(生成 AI 関連の最新情報のアップデートをご紹介) 


その前に、私たちについて(Development部)

U-NEXT HOLDINGS の AI 業務改革支援部では、ミッションとして「生成 AI を用いた業務効率や生産性の効率の向上」を掲げ、業務アプリケーションの開発、デジタルトランスフォーメーション( DX )を推進してます。現在は Azure 上の生成 AI モデルを利用し、社内専用の Web サービス「 Buddy 」の開発を行っています。チームの歴史がまだ浅いため、改善点は多いながらも、スタートアップのようにスピード重視でチャレンジングな環境が整備されています。(一緒にチャレンジしたくなりましたか?)

他方、私たちのグループでは、 Google Workspace の製品を利用する機会も多く、 Google Cloud の検証(その他サービス含め)、Dify などの生成 AI サービスの検証を積極的に行っています。


会場レポート

会場はみなとみらい

基調講演は満員御礼のため、筆者はサテライト会場で立ち見をしてました。
運動不足なのでちょうどよかったです。

基調講演では生成AI関連の話が盛りだくさんでした。Googleの生成AIリソースの日本語化も進んできて、今年は生成AIの「品質」にフォーカスしたリリースが多くありました。生成AIは「試す」から「実用」のフェーズへ移行していると言えそうです。

EXPO内にはGoogleのリソースを活用したものが展示されており、実際に触れて体験し理解することもできました。セッションまでの空き時間も、しっかり楽しんできました!


Google Cloud の生成AIリソース及びツールのご紹介

Google Cloud の生成 AI リソースである Vertex AI を簡単に紹介します。Google Cloudがわからない人もぜひご覧ください。できるだけわかりやすく記載します。

VertexAIについて

Vertex AI は Google Cloud のリソースの一つであり、AI・機械学習に関連するリソースは Vertex AI に統合されています。元々は機械学習のライフサイクル(モデルを本番稼働するまでの流れ)を支援するサービスとして作られたものでした。(図 1 )

従来、機械学習モデルを自動で管理するのは難しく「精度が落ちる」、「計算資源の不足」など、サービスに適応するには様々な課題がありました。これらの課題に対して、簡易に機械学習モデルを管理できるサービスとして Vertex AI(当時は AI Platform )が誕生しました。

現在では、 Vertex AI は機械学習モデルの管理に止まらず、生成 AI の管理もしてくれるように進化し、生成 AI の管理は LLMOps と呼ばれています。

図 1 . Vertex AI 概要説明

VertexAI の生成 AI サービスは大きく分けると3つのサービスで構築されています(図 2 )。各サービスは大規模言語モデル( LLM )を利用するハードルを大きく下げてくれます。

  • Agent Builder
       ローコードでエージェントを構築できるサービス

  • Model Builder :
       LLM モデルの管理、チューニングができるサービス

  • Model Garden :
       150 種類以上から選択し、大規模言語モデル( LLM )を利用できるサービス

図 2 . Vertex AI 生成 AI サービス構成

ここからは Vertex AI の3つの生成 AI サービスの特徴を紹介します。

Agent Builder

RAG を搭載したAI エージェントをローコードで構築することができます。 特別な知識を必要とせず構築できることから、利用者に優しいサービスとなっています。また、すでに利用している Google Drive などをデータソースとして適応できるため、資料の移動は発生しないことも利点といえます。(図 3 )

Google Cloud Nextでは、動画で見た服購入するデモが公開されており、簡単な利用(ユースケース)の流れをご紹介します。

デモの手順 (ユースケース)

  1. ユーザーがエージェントに対して、「この動画の男性が着てる服がほしいです。{動画のURL}」と指示する。

  2. エージェントは「ECサイトの探索(グラウンディング)」「商品データベースの探索」を行い、目的の商品をユーザーに回答する。

  3. ユーザーに新たな商品検索のUX(ユーザーの体験)を提供する。

図 3 . Agent Builderの特徴

Model Builder

大規模言語モデル(LLM)のカスタマイズ機能を提供し、モデル・プロンプトを管理することができます。

大規模言語モデル(LLM)でも依然として「精度」への課題が存在します。一例として、大規模言語モデル(LLM)は自分の知らないことでも、それっぽいことを答えてしまいます(ハルシネーション)。これらを制御し、ユーザに適切な回答をしなければなりません。

モデルの管理する様々な機能が実装されており、今回は基本的な2つの機能を紹介します。

図 4 . Model Builderの特徴

  • ファインチューニング

モデルに追加の学習をさせることをファインチューニングと言います。

大規模言語モデル( LLM )は事前に大規模なデータセットを学習しています。しかし、事前学習用のデータには「公開されていない社内データやサービスに関するデータ」は当然含まれておらず、大規模言語モデル( LLM )はそのことについて回答することはできません。これでは、サービスを展開するうえでの必要な回答をできず価値がありません。

これらの課題を解決するためにファインチューニングという手法で大規模言語モデル( LLM )に独自のデータ追加で学習させ、回答を得られるようにします。

  • Reinforcement learning from human feedback (RLHF)

モデルに回答の方針(良し悪し)を教える機能として Reinforcement learning from human feedback ( RLHF ) が提供されています。

大規模言語モデル( LLM )の回答が少し意図と異なったり、好みではないと感じたことはありませんか?サービスに大規模言語モデル( LLM )適応するうえではユーザーの UX(ユーザーの体験)を悪化させることになります。これらを防ぐために事前に回答の良し悪しを人間側で教え込みます。
応答のペア(質問と回答)を作り、どんな回答がよいのかを人間が評価します。その評価をモデルに教え、モデルは人間の評価をもとに回答が良いものであるか理解をしながら回答を改善していきます。これにより質の良い回答を得られるようにできます。また、人間の評価が多いほどモデルの回答が改善されやすくなります。

わかりやすく言い換えると、新人社員に対して「こうやって資料を作るほうがいいよね」などの評価・フィードバックを返し、新人社員が少しずつ良い資料を作れるようになる、そのようなイメージです。

以下に論文の URL も載せているので、ぜひご確認ください。

図 5 . Reinforcement learning from human feedbackの特徴

Model Garden

Google が作ったの生成 AI モデルだけではなく、オープンソースモデルも含めた 150 種類以上のモデルが利用可能です。言語モデルだけではなく、画像・動画に対応したモデルも備わっており、ユースケースに合わせてモデルを選択できます。これらのモデルは自社の Google Cloud 環境内に閉じており、追加でデータを読み込ませた場合でも安心に利用できるのが最大の魅力です。

図 6 . Model Gardenの実際のコンソール

以上 Vertex AI のご紹介でした。


Google Cloud Next 生成AI関連最新アップデート

ここからは Google Cloud Next で発表された、生成 AI 関連の最新アップデートをご紹介します。(※生成 AI に限ったアップデートになります。)ここもできるだけ優しく楽しく面白くを心がけて説明します。

Geminiの精度が1位に

Gemini とは Google が開発した、大規模言語モデル( LLM )です。非常に高度なアルゴリズムが適用されております。 Google の説明文をご紹介します。(アルゴリズムについても今後本サイトで紹介したいと考えております)

Google の説明引用

Gemini 1.5 は、Transformer および MoE アーキテクチャに関する Google の最先端の研究に基づいて構築されています。従来の Transformer は 1 つの大きなニューラル ネットワークとして機能しますが、MoE モデルはより小さな「エキスパート」ニューラル ネットワークに分割されます。

このような高度なアーキテクチャにより、モデルの精度が急速に向上しています。最近では LMSys Chatbot Arena Leaderboard にて、 Gemini1.5 が 1 位を取得しました。(図 7)

図 7 . Gemini の実際のコンソール

Gemini モデルバージョンアップ

Gemini のバージョンが 1.5 にアップデートされたことが発表されました。各モデルの特徴を以下の表にまとめました。

表1. Gemini1.5 モデルの種類

ML Processing in Japan

Gemini に関する処理が日本リージョンのみで完結します。

企業によっては「日本以外にデータを出すことはダメ」のようなセキュリティ要件が存在します。本リリースにより、 Gemini を企業やサービスでより適応しやすくなりました。

図 8 . ML Processing in Japanの発表

GeminiのSLA対応化

Geminiにサービス稼働の保障がされました。SLA(サービスレベルアグリーメント)は、サービス提供者と利用者の間で交わされる契約の一部で、提供されるサービスの品質やパフォーマンスを明確に定めたものです。

サービスに適応する上で品質(稼働率など)は懸念すべき指標の一つです。このような保障がないと、利用者側として要件を満たさない場合が存在します。このように Gemini の利用者に対して品質保障をかけることで、安心してGeminiを利用できるようになりました。

図 9 . GeminiのSLAの発表

Gemini 1.5 キャッシング機能

Gemini1.5 で読み込んだデータをキャッシングできるようになりました。マルチモーダル(複数のデータ形式)な処理を行うと、大規模言語モデル(LLM)は巨大な読み込みを実行します。これにより、レイテンシ(データ転送時間)が大きくなる。また、大きなデータ容量の処理が発生し利用金額が高くなります。本機能では回答にかかわる利用率の高いデータをキャッシングし、レイテンシ(データ転送時間)や利用金額コストを改善できます。

図 10 . Gemini 1.5 コンテキストキャッシング発表

Google Vids

Google Vidsは、テキスト指示でプレゼン動画を作成する動画生成AIです。ネット上の動画や画像、BGMを組み合わせ、ナレーション音声も生成します。新製品のPR動画や研修動画など、ビジネス向けに利用されます。

Google Vidsまだクローズドのサービスになっており、一般公開の時期は未定となっています。続報があり次第、弊社でも取り扱いたいと期待しています。


まとめ

Vertex AI の3つの主要サービス:

  • Agent Builder:ローコードでエージェントを構築する機能

  • Model Builder:LLM モデルの管理・チューニング機能

  • Model Garden:150 種類以上の 大規模言語モデル( LLM ) を利用できる機能

また、Google Cloud Next で発表された 生成 AI 関連の最新情報として以下をご紹介しました。

  • Gemini:Google が開発した大規模言語モデル( LLM )。最近、Gemini 1.5 が LMSys Chatbot Arena Leaderboard で1位を獲得しました。

  • Gemini モデルバージョンアップ

    • Pro:処理量が増加し、精度が向上。マルチモーダルデータ形式対応。

    • Flash:回答速度が速く、精度が向上。

  • ML Processing in Japan:Gemini の処理が日本リージョン内で完結するように。

  • GeminiのSLA対応化:サービス稼働の保障が提供され、企業利用が安心に。

  • Gemini 1.5 キャッシング機能:データキャッシングにより、レイテンシやコストを改善。

今後も様々な生成 AI の技術に関して、参加するイベントのレポート等も交えながら、最新の情報をご紹介していきます。お楽しみに!

高見拓磨(副編部)

AIとハタラクラボ by USEN WORK WELLのエディター、高見(人間)です。

AIとハタラクラボ by USEN WORK WELLは、株式会社USEN WORK WELLのAI Labが運営するオウンドメディアです。AIとハタラクラボは、グループ各社を対象としたAIを用いた業務改革支援にとどまらず、その先にある「AIとハタラク」のが当たり前の時代の、必要とされる次を創ります。あなたと、世の中全ての人たちのあるべき未来に近づけるために。

前へ
前へ

テクノロジーと人間のシナジー

次へ
次へ

AI時代にUIデザインをどう考えるか