デジタル通貨プラットフォームを支えるSREチーム
はじめに
SREチームのチームヘッドの小林です。
私が所属する SRE(Site Reliability Engineering)チームの取り組みをご紹介させていただき、当社の開発業務をイメージ頂けたら幸いです。
チーム構成
弊社の開発チーム全体は下記となります。
各チームは担当領域をそれぞれ担いますが、SREチームは各チームが取り組みにくい横断的な課題に取り組んでいます。
| チーム名 | 担当領域 |
|---|---|
| フロントエンド | Web、モバイルアプリ |
| バックエンド | API、Batch |
| DLT | ブロックチェーン、コントラクト |
| クラウド | インフラ、セキュリティ |
| SRE | 全体(横断的な課題解決、信頼性向上) |
SREチーム担当業務
SREチームが担当する業務は大きく3つあります。
- TOIL 削減
- 開発プロセス標準化
- パフォーマンス改善
TOIL 削減
昨年のローンチ以降さまざまな改善活動を実施してきました。しかし、リリース関連のツールやローカル開発用ツールなど、依然として手作業は残っており十分に改善しきれていない状況にあります。開発メンバーが本来の開発業務に専念できるよう継続的に TOIL 削減に取り組んでいます。
開発プロセス標準化
ドキュメント類を中心に全体最適化が十分にできていない状況です。現在は可読性・メンテナンスビリティ向上の観点から既存ドキュメントに対し全体構造の最適化、フォーマット・テンプレートの改善に取り組んでいます。
パフォーマンス改善
弊社プロダクトは多数のコンポーネントにて構成されている都合上、ログが分散し相関分析が難しい状況です。可視化の仕組みが十分にできていないため、継続的な改善に向けてダッシュボード類の整備に取り組んでいます。
技術スタック・ツール
横断的な課題に取り組む都合上、アプリケーションとクラウド両方の技術に触れる機会が多いです。また全体最適化の都合上、開発に付帯する各種開発ツール類の改善機会も多々あります。
- フロントエンド
- TypeScript、Next.js(React)、React Native
- バックエンド
- Java、Spring Boot、Spring Batch、Typescript、AWS SAM、Slate
- DLT
- HLB、Solidity(Hardhat)、Truffle、Caliper
- クラウド
- AWS(EKS Fargate、AWS Batch、Cognito、EC2、Lambda、S3、RDS、DynamoDB、 ALB、NLB、SQS)、NewRelic、Terraform、helm、ArgoCD、CFn
- その他開発ツール
- Jira/Confluence、Github(Actions)、Apache JMeter
今後の展望
SREチームの特徴の一つは、特定の技術領域にとどまらず幅広い技術スタックに取り組める点にあります。これは大きな魅力である一方、課題も多岐にわたり解決までのスピードを高めることが難しいという側面も抱えています。
こうした状況を踏まえ、現在は業務フローの根本的な見直しと手作業業務の自動化を進めることで生産性の向上に努めています。同様の課題に向き合っている組織やチームの方々とも知見を共有しながら、より良い取り組みへとつなげていきたいと考えています。
まとめ
いかがでしたでしょうか。本記事を通じて、弊社 SREチームの取り組みについて理解を深めていただき、少しでもご興味を持っていただくきっかけになれば幸いです。
Discussion