ずん
AWSに新しいサービスが出たらしいのだ。でもどうせまた難しいんでしょ?ボク触りたくないのだ。
でぇじょうぶ博士
むむむ、それは早計でやんす。Amazon S3 Tablesは、まるでレゴブロックのように簡単に組み立てられる画期的なサービスでやんす。
やきう
はぁ?レゴ?ワイはガンプラ派やけど、お前らオタクの例えはいつも的外れやな。
でぇじょうぶ博士
まあまあ、やきう君。要するに、従来のS3バケットとは違って、テーブル形式でデータを管理できるようになったんでやんす。データレイクとデータウェアハウスのいいとこ取りみたいなもんでやんすね。
ずん
ふーん。でもどうせ設定がめんどくさいんでしょ?ボク、CLIとか覚えるの嫌なのだ。
やきう
お前、エンジニアのくせにCLI嫌いとか終わっとるやんけ。そんなんでよう給料もらえるな。
でぇじょうぶ博士
いやいや、この記事を見る限り、管理コンソールからポチポチするだけでテーブルバケットが作れるでやんす。おいらでも5分でできたでやんすよ。
ずん
え、マジなのだ?じゃあボクでもできるってことなのだ?
やきう
できるわけないやろ。お前、昨日エクセルのマクロで躓いとったやんけ。
でぇじょうぶ博士
ま、まあ...。重要なのは、Athenaとの連携が自動でできることでやんす。「Athenaでテーブルのクエリを実行」をクリックするだけで、クエリまで生成されるんでやんす。まるで全自動洗濯機のように、ボタン一つで何でもやってくれるでやんす。
ずん
それってつまり、ボクが何も考えなくていいってことなのだ?
やきう
考えんでもええのはお前の特技やろ。今更何言うとんねん。
でぇじょうぶ博士
しかし、この記事の筆者も言ってるでやんすが、Lake Formationと組み合わせると途端に難易度が跳ね上がるでやんす。まるで、ポケモンでいうとコラッタを育ててたら突然ミュウツーと戦わされるようなもんでやんすね。
ずん
うわぁ、やっぱり難しいんじゃないか!最初から言えなのだ!
やきう
お前、さっきまで簡単って話に食いついとったやんけ。コロコロ意見変えんなや。
でぇじょうぶ博士
まあまあ。入門レベルなら本当に簡単でやんす。INSERT文を3回実行して、SELECT文で確認できたって書いてあるでやんすからね。おいらの計算によると...いや、おいらの経験から言えば、これは初心者でも十分扱えるレベルでやんす。
ずん
でも結局、AWSって料金が怖いのだ。気づいたら破産してるパターンなのだ。
やきう
それお前の浪費癖やろ。AWSのせいにすな。
でぇじょうぶ博士
まあ確かに、S3 Tablesの料金体系はまだ不透明な部分もあるでやんす。従量課金の世界は、まるで回転寿司で気づいたら一万円食べてたみたいな恐怖があるでやんすからね。
ずん
やっぱり怖いのだ!ボク、従来のS3バケットでいいのだ!
やきう
お前みたいな時代遅れの化石がおるから、日本のIT業界は遅れとるんやで。
でぇじょうぶ博士
しかしこのS3 Tables、Apache Icebergフォーマットをネイティブサポートしてるのが大きいでやんす。データの更新や削除が効率的にできるようになったんでやんすよ。従来のS3だと、まるで消しゴムのない鉛筆で書いてるようなもんだったでやんすからね。
ずん
Icebergって...氷山のこと?タイタニック号が沈んだやつなのだ?
やきう
お前、それ本気で言うとんか?小学生でももうちょいマシな発言するぞ。
でぇじょうぶ博士
Apache Icebergは、大規模なデータセットを効率的に管理するためのテーブルフォーマットでやんす。タイムトラベルクエリとか、スキーマエボリューションとか、色々な機能があるでやんす。まあずん君には理解できないと思うでやんすが...。
ずん
むぅ...タイムトラベルって、過去のデータが見れるってこと?それってバックアップみたいなもんなのだ?
やきう
おお、珍しくまともな質問しとるやんけ。お前、熱でもあるんか?
でぇじょうぶ博士
そうでやんす!過去のある時点でのデータ状態を参照できるんでやんす。まるでタイムマシンで過去に戻れるようなもんでやんすね。これはデータ分析において非常に重要な機能でやんす。
ずん
じゃあ、ボクが間違ってデータを消しちゃっても、過去に戻れば大丈夫なのだ?
やきう
お前、絶対やらかすやろ。保険かけとけよマジで。
でぇじょうぶ博士
まあ、そういう使い方もできるでやんすが、主な用途は監査やデータの整合性チェックでやんす。おいらの専門分野でやんすよ。
ずん
ふーん。でもやっぱり、Lake Formationとかいうのが絡むと難しくなるんでしょ?
やきう
お前、さっきから同じこと何回も聞いとんねん。記憶力ニワトリ並みか。
でぇじょうぶ博士
Lake Formationは、データレイクのアクセス制御を一元管理するサービスでやんす。まるで城の門番のように、誰がどのデータにアクセスできるかを厳密に管理するんでやんす。これとS3 Tablesを組み合わせると、エンタープライズレベルのデータ管理が可能になるでやんす。
ずん
つまり、セキュリティがガチガチになるってことなのだ?
やきう
そら当たり前やろ。お前みたいなアホがデータ触れんようにするためや。
でぇじょうぶ博士
やきう君、言い方がきついでやんす...。まあでも、その通りでやんすね。細かい権限設定ができるようになるでやんす。ただし、その分設定も複雑になるでやんす。まるでルービックキューブを解くような感じでやんすね。
ずん
うわぁ、やっぱりめんどくさいのだ。ボク、権限設定とか大嫌いなのだ。
やきう
お前、仕事で何が好きなんや?嫌いなもんばっかやんけ。
ずん
えっと...お昼休みと定時退社が好きなのだ!
でぇじょうぶ博士
...ずん君、それは仕事じゃないでやんす。
やきう
こいつマジで終わっとるな。よう会社クビにならんわ。
でぇじょうぶ博士
ま、まあまあ。話を戻すでやんすが、この記事の重要なポイントは、「とっつきにくいイメージがあったけど実際は簡単だった」という筆者の感想でやんす。新技術への心理的ハードルを下げてくれる良い記事でやんすね。
ずん
でも博士、結局のところS3 Tablesって何が嬉しいの?普通のS3じゃダメなのだ?
でぇじょうぶ博士
簡単に言うと、データの更新・削除が効率的にできて、SQLでクエリが書けて、トランザクション処理もサポートされてるでやんす。従来のS3は、まるで図書館の本を全部床にぶちまけたような状態でやんすが、S3 Tablesは綺麗に本棚に整理されてる感じでやんす。
ずん
なるほど...つまり、散らかった部屋が片付くってことなのだ?
やきう
その例えで理解できるんやったら、もっと早よ部屋片付けろや。
でぇじょうぶ博士
まあ、大体そんな感じでやんす。ただし、全てのユースケースでS3 Tablesが最適というわけではないでやんす。単純なファイル保存なら従来のS3で十分でやんすし、リアルタイム処理が必要ならDynamoDBの方が適してるでやんす。
ずん
じゃあ、どういう時にS3 Tablesを使えばいいのだ?
でぇじょうぶ博士
やきう君...。えーと、大規模なデータ分析とか、複数のチームでデータを共有する場合とか、データのバージョン管理が必要な場合に向いてるでやんす。まあ、ずん君の会社規模だと...うーん...。
やきう
使えんことはないけど、お前が使いこなせんってことやろ。
でぇじょうぶ博士
いやいや、そんなことないでやんす!この記事を見ればわかる通り、基本的な操作は本当に簡単でやんす。AmazonS3TablesFullAccess権限さえあれば、誰でも試せるでやんすよ。
ずん
権限...ボク、そんなの持ってないのだ。管理者に頼まないといけないのだ?
やきう
お前、管理者に嫌われとるやろ。絶対権限もらわれへんわ。
でぇじょうぶ博士
まあ、個人のAWSアカウントで試すこともできるでやんす。無料利用枠もあるでやんすし...って、ずん君、個人アカウント持ってるでやんすか?
ずん
持ってないのだ。作るのめんどくさいし、クレジットカード情報入れるの怖いのだ。
やきう
お前、エンジニアとして終わっとるわ。今すぐ転職しろ。
でぇじょうぶ博士
ま、まあ...。でも確かに、クラウドサービスの従量課金は恐ろしいでやんすからね。気をつけないと、まるでスマホゲームの課金地獄に陥ったかのように請求が来るでやんす。
ずん
やっぱり怖いのだ!ボク、オンプレミスでいいのだ!
やきう
令和の時代にオンプレとか言うとんか。お前、昭和生まれか?
でぇじょうぶ博士
しかし、この記事で注目すべきは、Athenaとのシームレスな連携でやんすね。クリック一つでクエリエディタが開いて、自動的にクエリが生成されるというのは、まるで執事が全部お膳立てしてくれるような便利さでやんす。
ずん
でも、SQLって難しいのだ。SELECT文くらいしか書けないのだ。
やきう
SELECT文すら怪しいやろ、お前。WHERE句付けられんのか?
ずん
え、えーと...WHERE...なんだっけ...条件指定するやつなのだ?
でぇじょうぶ博士
...まあ、大体合ってるでやんす。でも、この記事のINSERT文くらいなら、コピペで十分でやんすよ。おいらも最初はコピペから始めたでやんす。
やきう
博士、お前もそのレベルやったんか。なんか親近感湧いてきたわ。
でぇじょうぶ博士
な、何を言ってるでやんす!おいらは今や一流のデータエンジニアでやんす!ただ、最初はみんな初心者だったという話でやんす!
ずん
じゃあボクも頑張れば博士みたいになれるのだ?
でぇじょうぶ博士
まあ、努力次第でやんすね...。ところで、この記事の最後に「Lake Formationが絡んでくると少し難しくなる」とありるでやんすが、実際どれくらい難しいかというと...
ずん
もういいのだ!ボク、今日はもうお腹いっぱいなのだ!
やきう
お前、情報量少なすぎて腹いっぱいになるとか、脳みそのキャパ小さすぎやろ。
でぇじょうぶ博士
まあまあ、一度に全部理解する必要はないでやんす。この記事のように、まずは簡単なところから触ってみることが大事でやんす。おいらも最初は全然わからなかったでやんすからね。
ずん
そうなのだ?博士でもわからないことがあったのだ?
でぇじょうぶ博士
そうでやんす。でも、わからないことがあるからこそ、調べて学ぶ楽しさがあるでやんす。まるで謎解きゲームのように、一つ一つ解明していく過程が面白いでやんすよ。
ずん
むぅ...博士、ちょっとカッコいいこと言ってるのだ...
やきう
気持ち悪いから止めとけ、ずん。お前のキャラやないわ。
でぇじょうぶ博士
と、ともかく!S3 Tablesは、データレイクとデータウェアハウスの橋渡しをする重要な技術でやんす。今後、ますます普及していくことは間違いないでやんすね。
ずん
じゃあ、今のうちに勉強しといた方がいいってこと?でもめんどくさいのだ...
やきう
お前、さっきから「めんどくさい」しか言うてへんやん。語彙力どないなっとんねん。
でぇじょうぶ博士
まあ、無理に今すぐ覚える必要はないでやんすが、こういう技術があるということを知っておくだけでも価値があるでやんす。いざという時に「あ、これS3 Tablesで解決できるかも」と思いつけるかどうかが重要でやんすからね。
ずん
なるほど...引き出しを増やしておくってことなのだ?
やきう
お前、たまにまともなこと言うやん。奇跡か?
ずん
えへへ、ボクも たまには賢いこと言えるのだ!これで昇給間違いなしなのだ!