「AWS re:Invent」。それは、AWSに関わることがある人なら一度は耳にするであろうAWS最大のグローバルカンファレンス!
AWS関連の新サービスや新機能が発表され、 数千ものセッションやテクノロジーを満喫できる本カンファレンスは、毎年ラスベガスで開催されることもあり、AWS関連のイベントの中でもひときわワクワク感があるイメージがありました。

そんな「AWS re:Invent」に参加しては?と上司から声をかけられ、私も初めてラスベガスへ……!と言いたいところですが、時はコロナ禍。今年はオンライン開催のため、リモートワーク中の自宅から初参加することになりました。
ラスベガス、行きたいなあ…と夢見てしまいますが、私なんぞが社費で行かせてもらえるか分からない…(笑)。そう考えると、日本にいながらにして誰でも無料で、気軽にこのカンファレンスに参加できるのは、今年ならではの貴重な機会かもしれません。

AWS re:Invent 今回はオンラインで無料開催!|AWS (amazon.com)

英語ができなくても大丈夫!?「AWS re:Invent」参加登録

さて、自慢ではありませんが、私の英語力は中・高レベルで時を止めたまま…。「AWS re:Invent」には英語の堪能な方が参加するイメージだったので、恐る恐るイベントページを開きました。「よっしゃ、日本語!」。日本語のランディングページが用意されていました(ほっ)。
まずは、参加登録が必要です。ランディングページのファーストビューにある「今すぐ登録」をクリック!ちょ、待てよ。英語のフォームが出てきました。

焦ってトップページに引き返したところ、登録ボタンの下に「登録の手順(PDF)を見る」ボタンが!親切にも日本語の手順が出てきますので、問題なく登録できました。

登録したメールアドレスに「AWS re:Invent 2020 Registration complete」の 件名でメールが届きますので、承認ボタンを押して、無事登録完了です。

本カンファレンスは基調講演、新サービス発表、様々なセッションに加え、日本語によるセッションも視聴できます。
迷わず、日本語のセッションへ。
AWS社員の方が登壇するセッションだけでなく、サントリーさんやフジテレビさんといった日本人にとって馴染みのある企業のご担当者さんが登壇されるセッションなど10の日本語セッションが用意されていました。

上司から声をかけてもらったのが12/4。今回の「AWS re:Invent」の開催期間は11/30 (月) ~ 12/18 (金) 、1/12 (火) ~ 1/14 (木) で既に始まっています。この日以降のセッションを探そうと検索をかけると……。えっ?日本語のセッション全部終わっているやん!焦りました。しかし、今回はオンライン。ちゃんとアーカイブが残っていました。
ありがとう、オンラインカンファレンス……!

データレイクがテーマの日本語セッションに参加!動画視聴環境も◎

魅力的なセッションが目白押しの中、私が視聴したのはAWSのパートナーソリューションアーキテクトである大林 加奈子さんが登壇された「AWS ではじめるデータレイク 〜AWS のデータレイク関連サービス概要〜」です。というのも、アイレットは近年ますますデータレイク事業にも力を入れているからです。

文系の非エンジニア社員として、概要は理解しているつもりでも、もう少し学んでみたいと思っていた分野でした。
セッション説明文にある「AWS でデータ活用を始めてみませんか。」の文字に、初心者でもつかみやすい内容もあるのでは、と期待。動画はスムーズに立ち上がり、一時停止や10秒ごとのスキップも可能な動作環境で、安心して見られそうです。

例え話がわかりやすい!データレイク⇔データウェアハウスの違い

まずは大林さんの自己紹介から。「好きなAWSサービス」という項目を話されたのが、AWSカンファレンスならではと感じ、ニヤリ(笑。ちなみに、大林さんが好きなのはAnalytics関連のサービスでした)。

次に「データレイクとは」という基本的な概念の説明がありました。データレイクを検討する上で気になるのがデータウェアハウスとの違いは何なのか、ということではないかと思います。その説明に登場したのがなんと「西京焼き」!「西京焼きをつくるため、魚をさばいて、味噌に漬け込んだ形で保存してある状態」をデータウェアハウスと例え、「生魚、味噌などを生のまま保管し、さらに調理済みの鮭や、他の料理に利用できる肉も格納している状態」をデータレイクに例えていました。これはわかりやすい!
目的に合わせた加工済みデータを保存するデータウェアハウスと比べて、データレイクはデータを「生」のまま保存することができるから、現時点での使用用途だけでなく将来のニーズに備えることができる。もちろん「生」だけでなく、加工したデータも保存しておくことができるし、さらにまったく別のデータも保存しておくことができる(例では肉も保存しているのでお肉料理ができる、ということ)といったメリットをわかりやすく理解できました。

データレイク関連のAWSサービス、ユースケースを交えて紹介

そして、データレイクの各コンポーネント「収集」「保存」「変換」「分析」において、それぞれの用途に対応したAWSサービスの紹介がありました。あらゆるフェーズに対応したAWSサービスは実に多様で、ケースごとに必要なサービスを見極めるのは難しそうだと感じたのですが、「代表的なデータの利用者」として「ビジネスユーザー」「開発者」「データアナリスト」「データサイエンティスト」とスキルセットやニーズが異なる4者のパターン別にツールの紹介もあり、それぞれユースケースを交えた説明なので、具体的な活用を想像しやすいのではないかと感じました。

「データサイエンティスト」の項目では、応用的な分析や機械学習モデルの開発についても説明があり、AWSツールを使えば本当に高度なデータ運用/活用ができるのだなと改めて知ることができました。また、データ収集から可視化までのプロセスにおいて様々なAWSサービスを活用することができますが、そのAWSサービスのほとんどがデータレイクのコアである「Amazon S3」と連携できるのは、AWSならではの強みだと思いました。

データレイクの基本概念から、データレイク関連のAWSサービスまでバランスよく学ぶことができた本セミナー。データレイクや関連するAWSサービスについて知りたい人にとっては、幅広い知見を得られるのではないかと感じました。

「AWS re:Invent」オススメです!!

以上、今回は「AWS ではじめるデータレイク 〜AWS のデータレイク関連サービス概要〜」のセッションについてレポートしましたが、日本語のセッションだけでもあと9つあり、英語のセッションは星の数ほど!皆さんも、この機会に気になるセッションを視聴してみてはいかがでしょうか。

「AWS re:Invent」は年内12/18 (金)まで 、年明け1/12 (火) ~ 1/14 (木)の期間で開催。私もあといくつか視聴してみたいなと思います!