💪

「Snowflakeのすゝめ」の補足

2022/09/21に公開

前置き

こんにちは。株式会社GENDAのこみぃです。

元Z●Z●の知り合い(伏せ字の意味)から、自分の書いた同人誌の解説をすると良いという噂を聞きましたので、本日はそんなお話です。

「Snowflakeのすゝめ」をオンラインで頒布中です

本日解説する同人誌ですが、オンラインストアでの頒布が続いております。

https://techbookfest.org/product/vLgux1KQLD3KyAS0Bd0pey?productVariantID=41GY2QJnDwEQURiFJjEDak

本日の記事は多分↑を読まないとわけがわからないと思いますので、先に読んでから続きをお読みください。
無料で、15分あれば読み終わりますので忙しい方でも大丈夫です。

まえがき部分の解説

データ分析のすゝめ

福沢諭吉が「学問のすゝめ」を書いた人物であることについては何故か日本国民の9割がご存知だと思います。

冒頭の「天は人の上に人を造らず」というのがまさに「学問のすゝめ」のいちばん有名な一節なわけですが、これは「人には優劣はない」という道徳的な話ではなく、「もともと優劣がない人の間に学問をすることによって差が出るからちゃんと学問をしろ」という言説です。

データを活用することもまた人の能力に差を生む要因であると私は考えていますので、元ネタとしては最適でした。

第一章の解説

データウェアハウスの基本的な思想

かつてはデータを選別してからデータウェアハウスに入れたり、ある程度加工してからデータウェアハウスにいれるのがむしろ一般的だったように思います。
過去のデータウェアハウスはそれこそストレージ容量の概念がありましたし、大量のデータを捌く処理性能も現代ほど優れてはいなかったからです。

現代ではストレージの概念を超えたデータウェアハウスがあり、処理性能も大幅に上がっています。
であれば本書で書いているようにまずは全部集めておくのが一番良いというわけです。

2018年日本シリーズ

データ分析とスポーツには非常に密接な関係があるというか、スポーツはデータ分析の事例の宝庫です。

野球は特にデータの導入が進んでいます。
スポーツの特性として、野球はサッカーのように連続して時間が流れる形式ではなく場面場面で静止するので、特にデータが取りやすいのかなと思います。

個人的に近年の野球のデータ分析について最も進化したと思うのは 勝利貢献度という概念 だと思います。
これまでに存在した選手の優劣を表す指標自体が正しいものだったのかをビッグデータで解析するようになったのですね。
結果的に打率よりも長打率のほうが勝利貢献度が高いことがわかったりなどしました。

2018年の日本シリーズでは広島カープの機動力を封殺したということが評価されて甲斐選手がMVPになったわけですが、その裏で勝利貢献度が算出されていたとしたら面白いなと思いました。
あのシリーズには僅差のゲームがいくつもあったわけで、盗塁の成否が本当に勝利貢献度に強く影響した可能性もありえると思っています。
https://full-count.jp/2018/11/04/post242133/

さて、企業のKPIなどを分析する場合には、そもそもどの指標を重視すべきなのを考えるのが非常に重要になります。
目的に対しての貢献度という考え方を取り入れるとデータ活用の精度が飛躍的に上がります ので、心に留めて置かれると良いと思います。

ちなみに私はマツダスタジアムのチケットが取れなかった関係で第三、四戦のヤフオクドームでの試合を観に行ったのですが、特にこの2試合は広島ファンにとってはなかなかのつらさでした。

きのこたけのこ戦争

この話はブログでするには少々危険なのでここでは深くは触れません。
一つ言えるのは、もし 吉田沙保里選手がきのこ派に宗旨変えしたら、私もきのこ派に寝返る だろうということです。

GCPの思想

これもまた非常に危険な話題であるのですが、GCPは基本的にツールの使い方について強い思想が存在します。
この思想は全くおかしなことはなく、システムを常にイチから作るならその思想に則って構築すれば間違いない程度には理想的なものに思います。
しかし、世の中に存在するシステムは常に理想的ではありません。皆様身に覚えがあると思います。

逆にAWSは少々自由度が高すぎますので、どちらを取りたいかは担当者の好みになると思います。

Redshiftとストレージ容量

個人的にはデータウェアハウスにストレージ容量という概念があること自体が一昔前の思想という気がしています。

だからこそ、 Redshift Serverless には可能性を感じており、目が離せません。

柔道のルールの変遷

私が現役選手だった時代の一番大きな出来事としては、手で足を取るいわゆるタックル系の技が禁止されたというのがありました。
私はメインウエポンの一つがタックルだったので数少ない勝ち筋を一つ消されました。

特定の強すぎる戦術が支配的になってしまうのはその競技の面白さを損なってしまいます。
柔道の場合はタックル系の技はハメ技に近く、徹底すると相手の戦術にかなり縛りを生じてしまいます。禁止もやむなしではありました。
また、柔道はそもそも守って返し技を狙うほうが有利だったりするので、積極的に攻撃しなくてはならないようなルール変更も行われています。

こうやって並べていると柔道が競技にするには向いてないかのような印象を受けるかと思いますが、特定の強すぎる戦術をルールで禁止するというのは他のスポーツでも行われています。

例えばメジャーリーグでは2023年から内野守備の極端なシフトが禁止されます。
過去にはバスケットボールでゾーンディフェンスが禁止されたりもしました。

メジャーリーグの極端なシフトはビッグデータによって可能になった戦術です。
つまり データ活用によって可能になったことが競技自体のバランスを損ねてしまって禁止される というお話です。
これもまた データのすごさや扱いの難しさを示す例 なのかなと思います。面白いですね。

社会インフラ

自分が当たり前のように享受しているものは誰かの努力や労力で成り立っているという考え方は常に持っていたいものです。
もしこれを読んでハッとしたら、 あなたの会社のインフラや情シス担当者に話す際には、ぜひねぎらいの言葉をかけてあげてください

第二章の解説

将来性の大切さ

男の将来性の大切さについては荒木飛呂彦先生が作品の中で十分に語っている ので私から説明する必要は特にないでしょう。

知りたければジョジョの奇妙な冒険第四部を読みましょう。
https://amzn.to/3eXQbTz

Snowgrid

異なるリージョンやクラウド間のデータを一括で管理できるというのは想像しているよりも遥かにすごいことだと個人的には思っています。

その恩恵を受けるには扱うサービスがある程度大きい必要がありますが、企業がデータウェアハウスを選定する一つの理由になるのではないでしょうか?

データエンジニアの苦行

インフラ方面のエンジニアじゃないとイマイチ伝わらないことは重々承知なのですが、データ転送というのは 本当に本当にただただ苦行 です。

あなたの会社にデータ転送システムが存在するなら、たまにはそれを管理しているエンジニアに労いの言葉をかけてあげてください。

異国の音楽家が奏でたメロディ

言うまでもないですが、ジョン・レノンのImagineです。

Imagineが非常に印象的に使われている作品として、私が最も好きな作家の代表作である 「赤朽葉家の伝説」 があります。
https://amzn.to/3SaeX0V

長編が苦手な方は同じ作家の作品の中では私のイチオシは 「青年のための読書クラブ」 です。
https://amzn.to/3LkeJSI

平和を祈念するポーズ

長崎の平和記念公園にある平和祈念像ですね。
私はこの独特のポーズが好きで、本当にリアルにたまにこのポーズを取っています。

データを活用することは世界平和に寄与するか というのを原稿を書きながら考えていました。
はっきりと具体的な例が思い浮かびはしなかったのですが、 データを活用することは人や企業を団体単位で幸せにする方向に向かわせます
その先に世界の平和があると良いなと思っています。

長崎は日本の歴史にとって重要な場所でありながらどことなく異国の情緒を感じさせる土地で、日本の中でも独特な場所だと思います。

私はとある事情で7年ごとに福岡に行く習性がありますので、次かその次くらいにまた長崎に行こうかな。

Unistore

この機能は現状はパブリックになっていないのでまだ試すことができないのがもどかしい状況です。
パブリックにリリースされたらすぐにでも使ってレポートしたいと思っています。

あとがき部分の解説

ダイエットとデータ

ダイエットについての情報は近年では非常に知れ渡っていますので、ここで深く解説はしません(気になったらコメントやDMで聞いてくださいね)。

データという観点でここでお話しておくことが1つあります。

先程、野球におけるデータ分析において 勝利貢献度 という概念のお話をしたことを思い出してください。

他ならぬ私自身の体験から、特に現在体系についてお悩みの方にアドバイスしておきたく思います。

ダイエットをすることと栄養学についての知識を得ることがあなたの人生の幸福度に与える貢献度はあなたが思っているよりも遥かに高い です。

「筋肉は全てを解決する」、私の好きな言葉です。

カードゲームとデータ

この話は非常に長い話になるので、また別の機会にしっかり1つの記事でお話できればと思っています。
軽く説明しておくと、データをしっかりと活用することによりあなたは、あなたを勝利から遠ざけている主要因を知ることができます。

結びの言葉

こうして補足を書いていても、原稿にこういうことを書けばよかったとか色々思いついてしまうので困ったものです。
まあ、そのあたりは次回作に譲るとしましょう。

さて、今回の同人誌について語るのはこの記事が最後にします。同じネタで引っ張り続けるのもなんですからね。
他にも補足など知りたければ私にわかることならお答えしますので、お気軽にコメントをください。

最後に一つ宣伝を、私が所属する株式会社GENDAでは一緒に働く仲間をすごく真剣に求めています。
https://genda.jp/

お仕事でSnowflakeを使ってみたい方、データ方面で一旗あげたい方など、いらっしゃいましたらお気軽にお声おかけください。データ関連以外も歓迎します。

本日はこのあたりで。
それじゃあ、バイバイ!

Discussion