atama plusのSREチーム:EdTechサービスを支えるインフラの舞台裏と採用情報
こんにちは! atama plusの技術広報チームです。
この記事では、現在採用を強化中[1]のSREチームについて詳しくご紹介します。
atama plusは、AIを活用した教育サービスを提供するEdTech企業です。塾・予備校向けBtoB事業の進化、「atama+塾」フランチャイズ事業の立ち上げ、大学への高大接続プログラムの提供など、新たな取り組みを次々と展開しています。
このような事業拡大と増加するユーザーに対応するため、スケーラブルで可用性の高いクラウドインフラの設計・実装・運用を担当するSREエンジニアを募集しています。私たちと一緒に、教育の未来を支えるインフラを構築しませんか?
詳しくは、採用ページをご覧ください。
atama plusとは
チーム紹介の前に、簡単に会社の説明をさせていただきます!
atama plusは、「教育に、人に、社会に、次の可能性を。」をMissionに掲げる、2017年に設立された創業7年目のEdTech企業です。
現在展開している主な事業は以下の通りです:
1. 塾向けSaaS事業
全国の塾・予備校向けに、AIを活用したラーニングシステム「atama+」を提供しています。小中高生向けに、一人ひとり100%カスタマイズした学びを実現しており、「AI×人」という両者の強みを融合させた、新しい教育のあり方を目指しています。
2024年3月現在、4,000以上の塾教室に導入いただいております。
詳細はこちら
2. フランチャイズ事業「atama+塾」
atama+をSaaS型で教材として塾に提供する中で、塾運営においてどのようにatama+を活用するかによって生徒の成績向上等の成果が変わることが見えてきたことから、2022年から直営塾を立ち上げ、再現性高く成果が出る運営モデルの実証に取り組んできました。
これらの実証結果をふまえ、2024年6月より「atama+塾」を立ち上げ、全国にてフランチャイズ展開を開始しています。
詳細はこちら
3. オンライン塾事業
「自宅などの好きな場所で学習したい」というニーズに応え、2023年より直営の「atama+ オンライン塾」の運営を開始、2024年4月から本格展開しています。
詳細はこちら
4. 駿台atama+模試
atama plusと駿台がはじめた、オンラインで自宅から受験できる模試です。
きめ細かな弱点分析とフィードバックを試験終了直後から受けることができます。
模試を実力判定・志望校判定のツールで終わらせず、より効率よく力を伸ばす学びのサイクルへつなげます。
5. 高大接続プログラム
atama+を大学入試、入学前教育、初年次教育(リメディアル教育)として活用するプログラムです。立命館大学をはじめ、全国の大学で導入が広がっており、高校から大学への円滑な学びの接続を実現しています。
これらの事業を通じて、atama plusは教育のデジタル化と個別最適化を推進し、学習者一人ひとりの可能性を最大限に引き出すことを目指しています。
SREチームについて
ここからは、atama plusのSREチームについてご紹介します。
SREチームのミッション
SREチームは「atama plusサービスを支えるインフラ基盤を作る」がミッションです。
このミッション実現のために、私たちは次の活動に取り組んでいます:
- 堅牢なインフラの設計・構築
- サービスの可用性とスケーラビリティの維持・向上
- インフラレイヤーのセキュリティ強化
- 継続的な運用改善とコスト最適化
SREチームのビジョン
ミッションをより具体化し、目指すべきゴールを明確にするため、私たちは「SREチームビジョン」を定義しています。このビジョンは次の3つの柱から構成されています:
- ハイパフォーマンスチーム
- 安全なインフラを堅持する責任
- 信頼性の高いインフラの提供
SREチームビジョンを掲げた背景
SREチームは2019年に立ち上がりましたが、ビジョンを制定したのは2024年末のことです。
チームミッションの「atama plusサービスを支えるインフラ基盤を作る」は非常に広範な定義です。 そこで、「atama plusのSREチームとは、こうあるべき!」というイメージをチーム内で統一し、同じ方向に向かってチームの力を結集するため、ビジョンを定義することにしました。
SREチームでは四半期ごとに取り組むべきテーマを整理していますが、その際は以下の3つの軸を念頭に置いてテーマを決定しています:
- SREチームのビジョン・ミッション
- atama plusのビジョン・ミッション
- 当該四半期の事業注力テーマ
SREチームビジョンについて、次の章から詳しくご紹介します。
1. ハイパフォーマンスチーム
私たちは、小さなインプットで大きなアウトプットを得られる仕組み作りを重視しています。具体的には次のような取り組みを行っています:
- トイルの削減: 繰り返し発生する運用作業を自動化し、SREが本来力を発揮すべき領域にフォーカスできるようにします
- インフラコストの最適化: インフラコストを抑えつつ、高い価値を提供することを目指します
- 健全なチーム運営: メンバーが挑戦できる環境を継続的に整備し、チームの成長を促進します
2. 安全なインフラを堅持する責任
SREチームは、安全なインフラを維持する責任を担っています。
セキュリティは、ユーザーの信頼を得るための基盤であり、ビジネスの持続的成長にとって不可欠な要素です。
私たちは次の点に注力しています:
- セキュリティ対策の導入と維持
- 定期的なセキュリティアップデート
- インシデント発見・統制システムの整備
3. 信頼性の高いインフラの提供
ユーザーに安定したサービスを提供し、ビジネスの成長を支える強固な基盤を実現するため、私たちは次の取り組みを行っています:
- システムのスケーラビリティ、信頼性、効率性を向上
- サービスの信頼性を可視化し、評価し、改善していくプロセスを回す
- システム全体のパフォーマンス向上
これらのビジョンに基づき、SREチームは日々、atama plusのサービスを支える役割を果たしています。
SREチームの直近の実績
SREチームは日々挑戦を続けていますが、ここでは、直近の主要な取り組みについてご紹介します。
1. Heroku から AWS への移行 (2023年前半)
atama+のメインアプリケーション基盤は、これまでHeroku上に展開していました。
しかし、年間契約のライセンス費用が固定であることや、事業の成長とともにインフラに対する要望が増加し、将来性に課題を感じていました。
また、インフラはTerraformで管理していますが、HerokuのCloud AMQPやSendgridなどのadd-onsがTerraformで管理できず、インフラ構築時に手動作業が多く発生するという問題もありました。
これらの課題を解決するため、SREチームは2022年8月から2023年3月にかけて、HerokuからAWSへの移行プロジェクトを実施しました。
この移行により、インフラの柔軟性と管理性が向上し、事業の成長に合わせたスケーリングが可能になりました。
本プロジェクトの成功は、AWS社のお客様事例としても取り上げられました。
atama plus、主要アプリケーションの環境を AWS へ移行
2. 大幅なインフラコスト削減 (2023年後半)
2023年後半、円安の影響を受けて、インフラ関連予算と実績の間に大きな乖離が生じていました。
この状況に対応するため、SREチームは大規模なコスト削減対策に着手しました。
まず、コスト管理のルーティンを構築し、インフラ費用を詳細に分析しました。
その結果、不要なバックアップやスナップショットの削除、開発環境の自動停止、x86からArmへのCPUアーキテクチャ移行など、全体で数十件にわたるコスト削減施策を特定し、実施しました。
これらの取り組みを地道に積み重ねた結果、最終的にはインフラのコストを半額程度まで削減することに成功しました。
より具体的な施策内容については、次の資料でご覧いただけます。
3. 開発環境DBをAurora Serverless v2へ移行 (2024年前半)
2024年前半には、前年のコスト削減の取り組みをさらに発展させ、データベースのコスト最適化に取り組みました。
開発環境では環境面ごとに個別のデータベースを立てており、これが大きなコストの要因となっていました。
単純に夜間にデータベースを停止する案も検討しましたが、定期バッチの実行に支障をきたす可能性があり、開発者の作業効率低下やシステムの複雑化が懸念されました。
そこで、SREチームは新たなアプローチとして、開発環境のデータベースを1つのAurora Serverless v2インスタンスに統合し、その中で開発面ごとに論理データベースを分けるという手法を採用しました。
この移行により、環境面ごとに立てていたインスタンスを1つに集約し、Serverlessの特性を活かして負荷に応じた自動スケーリングを実現しました。
結果として、大幅なコスト削減と運用負荷の軽減を同時に達成できました。
この取り組みは、コスト最適化だけでなく、新技術の導入による運用効率の向上にも貢献し、SREチームの技術力向上につながりました。
今後取り組みたいこと
SREチームは、これまでの成果を踏まえつつ、さらなる進化を目指しています。
今後重点的に取り組む予定の主要な課題をご紹介します。
1. Platform Engineeringの推進
これまでatama plusでは、インフラの設計・構築をSREチームが一手に引き受けてきました。
開発者チームからの依頼を受け、SREチームがインフラの設計から構築、その後の運用保守まで担当するという流れです。
この方式には、ナレッジの蓄積やセキュリティの統制がしやすいというメリットがありました。
しかし、最近では新規サービスの急増に伴い、いくつかの課題が顕在化してきました。
まず、SREチームがサービスローンチのボトルネックになる懸念があります。
新規サービスの立ち上げが同時期に複数発生すると、SREチームの作業待ちが発生し、サービスローンチの遅延につながる恐れがあります。
また、管理すべきサービスの増加により、運用保守の負担が増大し、SREチームが本来注力すべきサービス可用性やスケーラビリティの向上、自動化などの活動にリソースを割けなくなるリスクも高まっています。
これらの課題に対応するため、SREチームではPlatform Engineeringの推進を段階的におこなっていく方針です。
具体的には、SREチームがこれまで蓄積してきた知見やベストプラクティスをベースにしたAWS CDKのラッパーライブラリを開発・提供しています。
このアプローチにより、開発者チームが自らインフラを構築し、サービスを運用できる環境を整備していきます。
SREチームは、このシンプルなプラットフォームの提供や開発者チームへのアドバイザリーに注力しつつ、サービス可用性、スケーラビリティ、自動化などのコアなSRE活動により多くのリソースを割り当てることを目指します。
この取り組みにより、組織全体のインフラ構築・運用能力の向上と、SREチームの本来の役割への集中を両立させることができると考えています。
2. インフラコストの最適化
2023年後半から2024年前半にかけて実施したAWSインフラのコスト最適化では一定の成果を上げましたが、さらなる最適化の余地があると考えています。
今後も継続的にインフラコストの削減に取り組んでいく予定です。
ただし、単純なコスト削減ではなく、ビジネス価値との整合性を常に意識することが重要です。
そのため、既存のインフラリソースに対しても、次のような本質的な問いかけを行いながら評価を進めています:
- 「このコストは売上やお客様への価値提供に貢献しているか?」
- 「より費用対効果の高い代替手段は存在しないか?」
- 「前提から疑って考え直す必要はないか?」
また、コスト最適化の取り組みは、新しい技術やアーキテクチャを採用する機会でもあると捉えています。 例えば、昨年のAurora Serverless V2の導入は、コスト削減だけでなく、新技術の検証や運用負荷の軽減にも貢献しました。
今後も、コスト最適化を通じて技術的な進化も同時に達成していきたいと考えています。
3. チーム体制の強化
現在SREチームは4名(内1名は業務委託)体制ですが、上記の取り組みを確実に実行し、さらなる成長を遂げるためには、SREチームの体制強化が不可欠です。
そのため、atama plusでは現在、SRE / クラウドインフラエンジニアのポジションで積極的な採用活動を行っています。
新たなチームメンバーを迎えることで、既存メンバーの知見や経験と新しい視点や技術を融合させ、より強固なSREチームを構築することを目指しています。
同時に、チーム内での知識共有や技術研鑽の機会を増やし、個々のメンバーのスキルアップとチーム全体の能力向上を図っていきます。
おわりに
ここまでお読みいただき、ありがとうございます。
atama plusのSREチームの活動と挑戦について、ご紹介させていただきました。
私たちSREチームは、日々成長を続けるatama plusのインフラ基盤を支える重要な役割を担っています。 HerokuからAWSへの大規模な移行や、インフラコストの大幅な削減など、様々な技術的チャレンジに取り組んできました。
今後も、Platform Engineeringの推進やさらなるインフラの最適化など、新たな課題に積極的に取り組んでいきます。
この記事を読んで興味を持たれた方、ぜひ採用ページ[1:1]をご覧ください。
エントリーいただきますと、最初はカジュアル面談となっておりますので、まずはお気軽にご応募いただければと思います!
Discussion