Gemma 4 31B + S3 Vectors + AgentCore で低コストな RAG を構築してみた | DevelopersIOdevelopersIOclassmethodFacebookXYouTube

ワイワレ速報

eye-catch

NEWS FEED

今日の話題を、1分で追えるニュースまとめ

人気記事

注目度の高い記事

blog.paypay.ne.jpのアイコン

Rustで進化するPayPayのスケーラビリティ

marushichi-tac.comのアイコン

TEA ARTISAN CRAFTED by 丸七製茶

mainichi.jpのアイコン

自民・麻生氏「いざとなったらやり返す合意も」　台湾情勢など巡り | 毎日新聞

news.yahoo.co.jpのアイコン

木村拓哉の代役に中国系俳優報道 - Yahoo!ニュース

news.yahoo.co.jpのアイコン

侍ジャパン 4-3で豪州に勝利 - Yahoo!ニュース

新着記事

最新投稿

オランダから日本、日本から欧州へ　「戦闘機外交」活発化の背景は：朝日新聞

大井競馬場に集まる外国人…なぜ？　目当ては「お宝」と他にない体験：朝日新聞

もっちゅりん祭り、スムージー祭り -- 消費者は「買う」から「参加する」へ #エキスパートトピ（中村智彦） - エキスパート - Yahoo!ニュース

サンデー毎日：「菊栄親睦会」除名も検討　久邇朝融のカネ・女性問題　錬金術と「女道楽」　社会学的皇室ウォッチング！／101　成城大教授・森暢平 | 週刊エコノミスト Online

スイスで人口に上限設ける国民投票　「日本になりたいか」と反対論も：朝日新聞

ずんスレ主

えっ、RAGって何ですか？難しい言葉ばっかりで僕の脳が追いつかないのだ。

でぇじょうぶ博士

RAGというのは、LLMが最新情報や専門知識を検索して、より正確な回答を生成する仕組みでやんす。今回はそれを安くつくる方法の紹介でやんす。

ずん

安い？いくら安いんですか？僕のお小遣いで買えるレベルですか？

でぇじょうぶ博士

Gemma 4という格安モデルとS3 Vectorsを組み合わせることで、従来のOpenSearch Serverlessなどと比べて大幅なコスト削減が可能でやんす。

やきう

つまりな、金のない貧乏企業でもAIチャットボット作れるようになったってわけや。格差社会の勝ち組と負け組が逆転する瞬間やで。

ずん

社会正義とか言わないでください。で、何がすごいんです？

でぇじょうぶ博士

Gemma 4 31Bはトークン単価が安いうえ、日本語性能も良く、ツール実行機能も備えているでやんす。S3 Vectorsはストレージとクエリ時の課金だけで済むんです。

かっぱ

つまりやな、昔は大企業しかできんかったことが、今は誰でもできるようになったってわけや。

ずん

で、実際に何ができるんですか？僕が楽できるようになるんですか？

でぇじょうぶ博士

チャットで社内ドキュメントを検索したり、AWS公式ドキュメントを自動で調べたり、回答の品質を自動評価できるでやんす。

やる夫

つまり、社員が同じ質問を何度もしなくていいってことだお？

でぇじょうぶ博士

その通りでやんす。ナレッジ検索、認証機能、会話履歴保持、ユーザーフィードバック収集など、実用的な機能が揃っているでやんす。

ずん

でも構築って難しくないですか？僕、プログラミング苦手なのだ。

でぇじょうぶ博士

CDKで自動化されており、リポジトリも公開されているので、初心者でも試しやすい環境になっているでやんす。

やきう

ほんまやで。昔は高い金払ってコンサル呼んでたような案件が、今はGitHubからコピペで済む時代になった。エンジニアの時給が下がるわけやな。

かっぱ

でも品質評価も自動でやるんやろ？Gemma 4が自分で自分の回答を採点するってわけか。

でぇじょうぶ博士

そうでやんす。Faithfulness、Relevancy、Completenessの3観点で自動評価するでやんす。人間が評価する手間も削減できるわけです。

ずん

つまり、AIが自分で自分を採点して、人間は何もしなくてよくなるってことですか？最高のシステムなのだ。

でぇじょうぶ博士

いや、ユーザーフィードバックも集めるので、人間の判断も組み込まれているでやんす。AIと人間の協働が重要でやんす。

やる夫

でも実装が複雑だと、結局誰も使わないんじゃないかお？

でぇじょうぶ博士

Amplify Gen 2とOpenAI互換APIで実装されているので、既存の知識で対応しやすいでやんす。初期ハードルが下がっているんです。

ずん

つまり、僕が社長なら、このリポジトリをコピペして、自社ドキュメント入れるだけで、AIチャットボット完成ってわけですね。楽だ〜。

Gemma 4 31B + S3 Vectors + AgentCore で低コストな RAG を構築してみた | DevelopersIOdevelopersIOclassmethodFacebookXYouTube