生成AIの波に乗れ!Generative AI Summit Tokyo ‘24 Fall参加レポート
概要
10/24開催のGenerative AI Summit Tokyo '24 Fallに潜入!会場の雰囲気から基調講演、ランチセッション、 個人的に面白かったセッションまで、エンジニア目線でわかりやすくレポートします。Geminiを使いこなすためのTips(コツ)やアプリ開発の秘訣、RAGの精度改善ポイントまで、 読み応え抜群の内容でお届けします!
目次
1.はじめに
こんにちは!USEN WORK WELL AILab 社内生成AIアプリケーション”Buddy”開発チームの古浜です。
2024年10月24日に開催された、Generative AI Summit Tokyo ‘24 Fall に現地参加してきました。
そこで本記事では、私が本イベントに参加して感じたことや学んだことをご紹介します!
2.会場の雰囲気
私の調査が間違っていなければ、前回のGenerative AI Summitは3月に六本木ヒルズで開催されたようですが、今回の会場は、渋谷駅のC1出口から歩いて5分をほど歩いたところにある「ベルサール渋谷ファースト」でした。
4.ランチセッションについて
基調講演が終わると、ランチセッションが始まりました。
そこではお昼ご飯と飲み物が無料で用意されており、私はサンドイッチとお茶をいただきました。美味しかったです。ありがとうございました。
私が参加したランチセッションは、「Geminiについて全部解説:Geminiの使い方やモデル、プランまで」というセッションです。
こちらのセッションは、Geminiを利用できるプランの説明など、Geminiを使ったことがないユーザー向けの内容に感じました。
その中で私が聞いてよかったと感じた点が以下の3つです。
4.1 自分が知らなかった知識
Geminiユーザーの私が知らなかった知識を得られました。
・Google FormでもGeminiを利用できること(Workspace Lab限定)
・企業版Geminiはモバイル版で利用することができないこと
・chromeで「@gemini」と入力するとすぐにGeminiを利用できること
4.2 より良い回答を得るためのTips
・ペルソナ指定:具体的な設定をする(キャラクター設定みたいなもの)
例)あなたはベテランエンジニアです。
・文脈、背景を伝える:どのような背景や状況があるのか、詳細のコンテキストを説明する
・具体的なタスクの説明:手順のリスト化といった単純なものから、ユーザーの意見を整理するような複雑なものまで記述する
・フォーマット指定:表、箇条書きリスト、文字数などの書式を指定する
・アウトプット例を提示:求めているものの例を挙げてみる。それに加えて、小学生向け、上司向けなど、アウトプット先の情報も必要に応じて指定する。
・追加指示を与える:1回のプロンプトで完璧な回答を得るのではなく、会話を通じてほしいアウトプットに近づいていく。
以下に記載する例は、実際に紹介された例になります。
例)
あなたは人気の動画クリエイターです。斬新な大人の夏休み自由研究をテーマに斬新で面白い動画企画を考えてください。「企画名」、「企画の詳細」、「面白いポイント」、「工夫ポイント」を軸に表でまとめてください。
先日業務の中でプロンプトを作成していた際、これらのTipsは非常に有効だと感じました。
4.3 日常向けとビジネス向けのユースケース
日常向けユースケース
・アイデア出し / 壁打ち相手として
例)夏休みの自由研究のテーマを20案考えて
・文章の代筆 / 創作のサポート
例)年賀状に合う蛇のかわいい絵を作って
・効率化 / 面倒なタスクの代行
例)スーパーのチラシ(画像)から今週の献立を考えて
・旅行 / ワークアウト / 献立のプランニング
例)家族4人、2泊3日、熱海での旅行プランを考えて
・ゲームやクイズの出題
例)ゴルフコンペで使えるクイズを出して
ビジネス向けユースケース
・市場調査やクイックリサーチ
例)ドライブ(@google drive)の〇〇という書類を読んで、〇〇についてまとめて分析してグラフを書いて
・レビュー分析やアンケート調査を効率的に
例)【添付したURL】このURLのデータを分析して集計して
・SNS投稿やブログ記事をドラフト
例)〇〇という内容をSNSに投稿するのでドラフトして
・カスタムGem
例)コーディングパートナー
私もこの中にあるカスタムGemをよく利用しています。
5.参加したセッションの感想
ここでは、私が受講したセッションの内容の一部とその感想について記述します。
・スピーディーにやる!生成AIを利用したアプリケーションの開発
スリーシェイク社が開発した「Geake」というGeminiを活用したアプリの紹介と、生成AIを利用したアプリ開発をするときに作成するPoCに向けた、爆速で開発できる手法の紹介でした。
Buddyには機能毎にモードがありますが、Geakeでは役職毎にモードを分けており、ビジネス、リーガル、マーケティング、カスタマーサポート、エンジニアモードがあります。PoCに向けたおすすめ開発手法は「Streamlit + cloud run」がいいそうです。Streamlitとは、pythonでできるオープンソースフレームワークで、Buddyの開発手法であるFast API(APIを最初に設計・開発する ソフトウェア開発手法)に似ているように感じました。Streamlitの強みは、直感的で簡単に利用できる点です。Cloud Runはサーバーレスでコンテナをサポートするものであり、従量課金制です。
・75%の精度向上実績あり~ソフトバンクが実践を重ねるRAGの精度改善Tips
個人的に一番面白かったのがこのセッションでした。
発表内容は、RAGの精度改善箇所のポイントの紹介と、自社サービスの紹介でした。
・RAGの精度改善箇所のポイント
RAGの精度改善箇所のポイントは、全部で6箇所ありました。
プロンプト改善(システムも含む)
→ 検索不可時に質問者に聞き返すように促すなど
クエリ拡張
→ LLMで1度クエリを加工(よりよいクエリにする)して、そのクエリを使用する
検索の改善
→ テキスト、ベクトル検索の両方をとったハイブリット検索を利用する
→ リランク:RAGの検索結果をサイド並び替える手法
→ フィルタリング:メタデータ(カテゴリーなど)によりアクセス制御
モデル選択
→ やはりGemini 1.5 Proなど、上位モデルの方が良さそうでした
ベクトル化手法の改善
→ ベクトル化手法:文書検索のためチャンク(一定サイズに分割したデータ)をベクトル化
→ Enbeddingモデル:埋め込みモデルのベンチマークを参考にするといいそうです(MTEB)
データ改善
データをクレンジング → chund分割 → 記法工夫 → 情報付加の順番で加工します
→ クレンジング:特にPDFは処理が必要なことが多い
→ chund分割:適切な意味の区切りで分割することが重要
→ 記法工夫:マークダウン記法推奨
→ 情報付加:文書検索に必要な情報を付与
この中で一番効果があるのが、「データ改善」でした。
6.最後に...
本イベントのアーカイブ動画はすでに公開されていますので、もし興味を持っていただければ、ぜひ一度ご覧になってください。
7.余談
本イベントの15時半前後から、Gemini Tシャツが当たる抽選がありましたが、なんと当選しました!普段から、Google のアイテムを愛用していることが実を結んだのかもしれません。(メインスマホはPixel 8 Pro、メインタブレットはPixel Tabletです)
次にGoogleのイベントに参加する際は、このTシャツを着て参加しようと思います。
執筆、編集作業と所要時間
所要時間: 360分
・人間: 300分
・AI: 60分
内訳
・記事執筆(by 人間): 60分
・プロンプト作成(by 人間):240分
・誤字脱字の確認(by AI): 5分
・編集(by AI): 30分
・添削(by AI): 30分
人間のみで記事作成した場合に想定される所要時間: 約24時間
AIによる所要時間削減率: 75%