人気記事
注目度の高い記事

NEWS FEED
今日の話題を、1分で追えるニュースまとめ
注目度の高い記事
ずんスレ主
えっ、RAGって何ですか?難しい言葉ばっかりで僕の脳が追いつかないのだ。
でぇじょうぶ博士
RAGというのは、LLMが最新情報や専門知識を検索して、より正確な回答を生成する仕組みでやんす。今回はそれを安くつくる方法の紹介でやんす。
ずん
安い?いくら安いんですか?僕のお小遣いで買えるレベルですか?
でぇじょうぶ博士
Gemma 4という格安モデルとS3 Vectorsを組み合わせることで、従来のOpenSearch Serverlessなどと比べて大幅なコスト削減が可能でやんす。
やきう
つまりな、金のない貧乏企業でもAIチャットボット作れるようになったってわけや。格差社会の勝ち組と負け組が逆転する瞬間やで。
ずん
社会正義とか言わないでください。で、何がすごいんです?
でぇじょうぶ博士
Gemma 4 31Bはトークン単価が安いうえ、日本語性能も良く、ツール実行機能も備えているでやんす。S3 Vectorsはストレージとクエリ時の課金だけで済むんです。
かっぱ
つまりやな、昔は大企業しかできんかったことが、今は誰でもできるようになったってわけや。
ずん
で、実際に何ができるんですか?僕が楽できるようになるんですか?
でぇじょうぶ博士
チャットで社内ドキュメントを検索したり、AWS公式ドキュメントを自動で調べたり、回答の品質を自動評価できるでやんす。
やる夫
つまり、社員が同じ質問を何度もしなくていいってことだお?
でぇじょうぶ博士
その通りでやんす。ナレッジ検索、認証機能、会話履歴保持、ユーザーフィードバック収集など、実用的な機能が揃っているでやんす。
ずん
でも構築って難しくないですか?僕、プログラミング苦手なのだ。
でぇじょうぶ博士
CDKで自動化されており、リポジトリも公開されているので、初心者でも試しやすい環境になっているでやんす。
やきう
ほんまやで。昔は高い金払ってコンサル呼んでたような案件が、今はGitHubからコピペで済む時代になった。エンジニアの時給が下がるわけやな。
かっぱ
でも品質評価も自動でやるんやろ?Gemma 4が自分で自分の回答を採点するってわけか。
でぇじょうぶ博士
そうでやんす。Faithfulness、Relevancy、Completenessの3観点で自動評価するでやんす。人間が評価する手間も削減できるわけです。
ずん
つまり、AIが自分で自分を採点して、人間は何もしなくてよくなるってことですか?最高のシステムなのだ。
でぇじょうぶ博士
いや、ユーザーフィードバックも集めるので、人間の判断も組み込まれているでやんす。AIと人間の協働が重要でやんす。
やる夫
でも実装が複雑だと、結局誰も使わないんじゃないかお?
でぇじょうぶ博士
Amplify Gen 2とOpenAI互換APIで実装されているので、既存の知識で対応しやすいでやんす。初期ハードルが下がっているんです。
ずん
つまり、僕が社長なら、このリポジトリをコピペして、自社ドキュメント入れるだけで、AIチャットボット完成ってわけですね。楽だ〜。
Gemma 4 31B + S3 Vectors + AgentCore で低コストな RAG を構築してみた | DevelopersIO引用元:https://dev.classmethod.jp/articles/gemma4-s3vectors-agentcore-rag/