もう一度読むSRE
Episodes
もう一度読むSRE #127 / SREをはじめよう 3章
19 May 2026
Contributed by Lukas
3章 SREの文化
もう一度読むSRE #126 / SREをはじめよう 2章
11 May 2026
Contributed by Lukas
2章SREの心構え
もう一度読むSRE #125 / SREをはじめよう 1章
21 Apr 2026
Contributed by Lukas
SREをはじめよう1章 はじめに
もう一度読むSRE #124
07 Apr 2026
Contributed by Lukas
34章 まとめ
もう一度読むSRE #123
30 Mar 2026
Contributed by Lukas
33章 他の業界からの教訓
もう一度読むSRE #122
19 Mar 2026
Contributed by Lukas
32章 進化する SREのエンゲージメントモデル ~ 32.7 まとめ
もう一度読むSRE #121
12 Mar 2026
Contributed by Lukas
31.4 SRE外でのコラボレーションから 31.6 まとめまで
もう一度読むSRE #120
05 Mar 2026
Contributed by Lukas
31.3 SRE内でのコラボレーションのケーススタディ:Viceroy ~ 31.3.3 推奨事項まで
もう一度読むSRE #119
07 Jan 2026
Contributed by Lukas
31章SREにおけるコミュニケーションとコラボレーションから31.2.2 効率的な作業のための手法まで
もう一度読むSRE #118
24 Dec 2025
Contributed by Lukas
30章 SREの投入による運用過負荷からのリカバリから30.4 まとめ
もう一度読むSRE #117
03 Dec 2025
Contributed by Lukas
29.3.3 真剣な解決策から29.3.4.2 顧客と共に自分も尊重することまで
もう一度読むSRE #116
13 Nov 2025
Contributed by Lukas
29 章 割り込みへの対処から29.3.2.2 時間の二極化まで
もう一度読むSRE #115
05 Nov 2025
Contributed by Lukas
28.3 優れたリバースエンジニアリングと柔軟な思考の育成から28.6 まとめまで
もう一度読むSRE #114
08 Oct 2025
Contributed by Lukas
第4部管理 28章 SREの成長を加速する方法:新人からオンコール担当、そしてその先へ 〜 28.2.2 単純作業ではなく...
もう一度読むSRE #113
25 Jun 2025
Contributed by Lukas
27.5 LCEの発展から27.6 まとめまで
もう一度読むSRE #112
11 Jun 2025
Contributed by Lukas
27.2.2 収束と単純化の推進 から 27.4.4 過負荷時の挙動とロードテスト まで
もう一度読むSRE #111
04 Jun 2025
Contributed by Lukas
27 章 大規模なプロダクトのローンチにおける信頼性 から 27.2 ローンチプロセスのセットアップ まで
もう一度読むSRE #110
28 May 2025
Contributed by Lukas
26.4.2 Google Music - 2012年3月:暴走した削除の検出から26.6 まとめまで
もう一度読むSRE #108
21 May 2025
Contributed by Lukas
26-3-6第3のレイヤーから26-3-6-2通常の処理外でのデータ検証まで
もう一度読むSRE #109
30 Apr 2025
Contributed by Lukas
26.3.6 第3のレイヤー:早期の検出から26.4.1 Gmail - 2011年2月:GTapeからのリストアまで
もう一度読むSRE #107
23 Apr 2025
Contributed by Lukas
26.3.3 第2のレイヤー:バックアップと関連するリカバリの方法 から 26.3.5 テラバイト対エクサバイト:大きい「だ...
もう一度読むSRE #106
18 Apr 2025
Contributed by Lukas
26.3 データ完全性の課題へのGoogle SREの対処 から 26.3.2 第1のレイヤー:論理削除 まで
もう一度読むSRE #105
02 Apr 2025
Contributed by Lukas
26.2.3 データの損失につながる障害の種類から26.2.4.2 リテンションまで
もう一度読むSRE #104
26 Mar 2025
Contributed by Lukas
26.1.3 大局的な視点から見たクラウド環境の要件 から 26.2.2 バックアップシステムよりもリカバリのシステムを提...
もう一度読むSRE #103
12 Mar 2025
Contributed by Lukas
26章 データの完全性から26.1.2 バックアップとアーカイブまで
もう一度読むSRE #102
19 Feb 2025
Contributed by Lukas
25.5.1 定期パイプラインにおけるモニタリングの問題 から 25.6.1 Model-View-ControllerパターンとしてのWorkflow まで
もう一度読むSRE #101-番外編
12 Feb 2025
Contributed by Lukas
もう一度読むSRE #101で話した雑談回です。
もう一度読むSRE #101
05 Feb 2025
Contributed by Lukas
25.3 定期的なパイプラインパターンでの課題 から 25.5 分散環境における定期パイプラインの欠点 まで
もう一度読むSRE #100
22 Jan 2025
Contributed by Lukas
24.4.5 大規模なcronの実行 から 25.2 シンプルなパイプラインパターンでのビッグデータの 初期の効果 まで
もう一度読むSRE #99
09 Jan 2025
Contributed by Lukas
24.4.3.3 部分的な障害の解決 から 24.4.4 状態の保存
もう一度読むSRE #98
18 Dec 2024
Contributed by Lukas
24.4.3 リーダーとフォロワーの役割〜24.4.3.2 フォロワーまで
もう一度読むSRE #97
04 Dec 2024
Contributed by Lukas
24.3.2 拡張された要求から24.4.2 Paxosの利用まで
もう一度読むSRE #96
30 Oct 2024
Contributed by Lukas
24 章 cronによる分散定期スケジューリング から 24.3.1 拡張されたインフラストラクチャ まで
もう一度読むSRE #95
16 Oct 2024
Contributed by Lukas
23.5.3.1 クォーラムの編成 〜 23.7 まとめ
もう一度読むSRE #94
27 Jul 2024
Contributed by Lukas
23.5.3 キャパシティとロードバランシング
もう一度読むSRE #93
18 Jul 2024
Contributed by Lukas
23.5.2 レプリカの配置
もう一度読むSRE #92
22 May 2024
Contributed by Lukas
23.5 分散合意ベースのシステムのデプロイ〜 23.5.1 レプリカ数
もう一度読むSRE #91
24 Apr 2024
Contributed by Lukas
23.4.8 ディスクアクセス
もう一度読むSRE #90
10 Apr 2024
Contributed by Lukas
23.4.5 パフォーマンスに関する考察:Fast Paxos から 23.4.7 バッチ処理 まで
もう一度読むSRE #89
27 Mar 2024
Contributed by Lukas
23.4.2 読み取り負荷が大きいワークロードのスケーリングから23.4.4 分散合意のパフォーマンスとネットワ...
もう一度読むSRE #88
11 Mar 2024
Contributed by Lukas
23.4.1 Multi-Paxos:詳細なメッセージフロー
もう一度読むSRE #87
07 Feb 2024
Contributed by Lukas
23.3.5 信頼性を持つ分散キュー及びメッセージング から 23.4 分散合意のパフォーマンス まで
もう一度読むSRE #86
31 Jan 2024
Contributed by Lukas
23.3.3 リーダー選出を利用する高可用性を持つ処理 から 23.3.4 分散協調及びロックサービス まで
もう一度読むSRE #85
24 Jan 2024
Contributed by Lukas
23.3 分散合意のためのシステムアーキテクチャパターン から 23.3.2 信頼性を持つ複製データストア及び設定...
もう一度読むSRE #84
25 Dec 2023
Contributed by Lukas
23.2 分散合意の動作 から 23.2.1 Paxosの概要: サンプルプロトコル まで
もう一度読むSRE #83
25 Oct 2023
Contributed by Lukas
23.1 合意を利用する目的:分散システムの協調障害 から 23.1.3 ケーススタディ 3:問題のあるグループメンハ...
もう一度読むSRE #82
18 Oct 2023
Contributed by Lukas
23章 クリティカルな状態の管理: 信頼性のための分散合意
もう一度読むSRE #81
14 Sep 2023
Contributed by Lukas
SRE NEXT 2023 Chair ぐりもおさん をゲストに迎え、SRENEXTのことをお聞きしました。
もう一度読むSRE #80
23 Aug 2023
Contributed by Lukas
22.6 カスケード障害に対応するためにすぐに行うべき手順 から 22.7まとめまで
もう一度読むSRE #79
17 Aug 2023
Contributed by Lukas
22.4 カスケード障害を引き起こす条件 から 22.5.3 重要度の低いバックエンドのテスト まで
もう一度読むSRE #78
10 Aug 2023
Contributed by Lukas
22.3 起動直後の低パフォーマンスとコールドキャッシュ から 22.3.1 スタックは常に下っていくようにすること...
もう一度読むSRE #77
20 Jul 2023
Contributed by Lukas
22.2.4 レイテンシとタイムアウト から 22.2.4.4 二峰性のレイテンシ まで
もう一度読むSRE #76
05 Jul 2023
Contributed by Lukas
22.2.2 ロードシェディングとグレースフルデグラデーション から 22.2.3 リトライ まで
もう一度読むSRE #75
28 Jun 2023
Contributed by Lukas
22.1.3 利用できないサービス から 22.2.1 キューの管理 まで
もう一度読むSRE #74
15 Jun 2023
Contributed by Lukas
22章 カスケード障害への対応 から 22.1.2.5 リソース間の依存関係 まで 本編は12分05秒あたりからになります。
もう一度読むSRE #73
07 Jun 2023
Contributed by Lukas
21.7 接続によって生じる負荷 から 21.8 まとめ まで
もう一度読むSRE #72
31 May 2023
Contributed by Lukas
21.5 利用率のシグナル から 21.6.1 リトライの判断 まで
もう一度読むSRE #71
24 May 2023
Contributed by Lukas
21.3 クライアント側でのスロットリング から 21.4 重要度 まで
もう一度読むSRE #70
10 May 2023
Contributed by Lukas
21章 過負荷への対応 から 21.2 顧客単位での制限 まで
もう一度読むSRE #69
26 Apr 2023
Contributed by Lukas
20.4 ロードバランシングのポリシー から 20.4.1.3 マシンのばらつき まで
もう一度読むSRE #68
05 Apr 2023
Contributed by Lukas
20.3.3 サブセット選択のアルゴリズム : 決定的なサブセット選択
もう一度読むSRE #67
29 Mar 2023
Contributed by Lukas
20.3 サブセットの設定によるコネクションプールの制限 から 20.3.2 サブセットの選択アルゴリズム:ラ...
もう一度読むSRE #66
23 Mar 2023
Contributed by Lukas
20章 データセンターでのロードバランシング から 20.2.2 不健全なタスクへの確実なアプローチ:レイ...
もう一度読むSRE #65
16 Mar 2023
Contributed by Lukas
19.3 仮想 IP アドレスでのロードバランシング まで
もう一度読むSRE #64
27 Feb 2023
Contributed by Lukas
19章 フロントエンドにおけるロードバランシング から 19.2 DNS を使ったロードバランシング まで...
もう一度読むSRE #63
02 Feb 2023
Contributed by Lukas
18.3.5 チームの力学 から 18.5 まとめ まで
もう一度読むSRE #62
25 Jan 2023
Contributed by Lukas
18.3.4 認知の向上と採用の推進 から 18.3.4.4 適切なレベルでの設計 まで
もう一度読むSRE #61
04 Jan 2023
Contributed by Lukas
18.3.2 Auxon の紹介 から 18.3.3.1 近似 まで
もう一度読むSRE #60
28 Dec 2022
Contributed by Lukas
18.2.2 Google におけるソリューション:インテントベースのキャパシティプランニング から 18.3.1.2 パフォーマンス...
もう一度読むSRE #59
07 Dec 2022
Contributed by Lukas
18章 SRE におけるソフトウェアエンジニアリング から 18.2 Auxon のケーススタディ:プロジェクトの背景と問題...
もう一度読むSRE #58
01 Dec 2022
Contributed by Lukas
17.3.7 プロダクション環境におけるプローブ から 17.4 まとめ まで
もう一度読むSRE #57
16 Nov 2022
Contributed by Lukas
17.3.6 結合 まで
もう一度読むSRE #56
06 Nov 2022
Contributed by Lukas
17.3.5 予想されるテストの失敗 まで
もう一度読むSRE #55
27 Oct 2022
Contributed by Lukas
17.3.4 プロダクションへのプッシュ
もう一度読むSRE #54
19 Oct 2022
Contributed by Lukas
17.3.2 ディザスタのテスト から 17.3.3 速度の重要性 まで
もう一度読むSRE #53
11 Oct 2022
Contributed by Lukas
17.3 大規模なテスト から 17.3.1 スケーラブルなツールのテスト まで
もう一度読むSRE #52
04 Oct 2022
Contributed by Lukas
17.2 テストの作成と環境の構築 まで
もう一度読むSRE #51
14 Sep 2022
Contributed by Lukas
17.1.2.2 ストレステスト から 17.1.2.3 カナリアテスト まで
もう一度読むSRE #50
31 Aug 2022
Contributed by Lukas
17.1.2 プロダクションテスト から 17.1.2.1 設定テスト まで
もう一度読むSRE #49
24 Aug 2022
Contributed by Lukas
17 信頼性のためのテスト から 17.1 ソフトウェアテストの種類 まで
もう一度読むSRE #48
18 Aug 2022
Contributed by Lukas
16章 サービス障害の追跡 から 16.2.4 予想外のメリット まで
もう一度読むSRE #47
03 Aug 2022
Contributed by Lukas
15章 ポストモーテムの文化: 失敗からの学び から 15.4 まとめと改善の継続 まで
もう一度読むSRE #46
26 Jul 2022
Contributed by Lukas
15章 ポストモーテムの文化: 失敗からの学び から 15.1 Google におけるポストモーテムの哲学 本編は3分35秒からです...
もう一度読むSRE #45
19 Jul 2022
Contributed by Lukas
14.3 インシデント管理のプロセスの構成要素 から 14.5 インシデントと宣言すべき場合 まで 本編は11分00秒からで...
もう一度読むSRE #44
29 Jun 2022
Contributed by Lukas
13.6 過去から学び、繰り返さない から 14.3.4 はっきりとした引き継ぎ まで 本編は6分22秒からです。
もう一度読むSRE #43
22 Jun 2022
Contributed by Lukas
13.4 プロセスが引き起こした緊急事態 から 13.5 解決できない問題は存在しない まで 本編は3分10秒から...
もう一度読むSRE #42
14 Jun 2022
Contributed by Lukas
13.3 変更が引き起こした緊急事態 から 13.3.3.2 学んだこと まで 本編は4分10秒からになります。
もう一度読むSRE #41
06 Jun 2022
Contributed by Lukas
13章 緊急対応 から 13.2.3.2 学んだこと まで 本編は5分50秒からになります。
もう一度読むSRE #40
30 May 2022
Contributed by Lukas
12.4 ケーススタディ から 12.6 まとめ まで 今回雑談はありません。
もう一度読むSRE #39
13 May 2022
Contributed by Lukas
12.2.5 テストと対応 から 12.3 否定的な結果の素晴らしさ まで 今回雑談はありません。
もう一度読むSRE #38
02 May 2022
Contributed by Lukas
12.2.4 診断から 12.2.4.4 特定の診断 まで 本編は4分03秒からです。
もう一度読むSRE #37
26 Apr 2022
Contributed by Lukas
12.2 実践 から 12.2.3 検証 まで 雑談はありません。
もう一度読むSRE #36
18 Apr 2022
Contributed by Lukas
12章 効果的なトラブルシューティング から 12.1 理論 まで 本編 : 03:10〜
もう一度読むSRE #35
06 Apr 2022
Contributed by Lukas
11.5 不適切な負荷の回避 から 11.6まとめ まで 本編 : 03:45〜
もう一度読むSRE #34
30 Mar 2022
Contributed by Lukas
11.3 バランスの取れたオンコール から 11.4 安心感 まで 本編 : 00:00〜 ※今回雑談はありません。
もう一度読むSRE #33
24 Mar 2022
Contributed by Lukas
11章 オンコール対応 から 11.2 オンコールエンジニアの日常生活 まで 雑談 : 00:00〜04:02 本編 : 04:03〜
もう一度読むSRE #32
17 Mar 2022
Contributed by Lukas
10.4 時系列のアリーナにおけるストレージ から 10.10 10 年が経過して まで 雑談 : 00:00〜07:05 本編 : 0...
もう一度読むSRE #31
06 Mar 2022
Contributed by Lukas
10章 時系列データからの実践的なアラート から 10.3 エクスポートされたデータの収集 雑談 : 00:00〜02:09 本...
もう一度読むSRE #30
16 Feb 2022
Contributed by Lukas
第III部 実践 雑談 : 00:00〜03:07 本編 : 03:08〜
もう一度読むSRE #29
06 Feb 2022
Contributed by Lukas
9.5 最小限のAPI から 9.8 単純な結論 まで