「もう一度読むSRE」は、株式会社Topotal(トポタル)の高村と菱田がディスカッション形式で「SRE サイトリライアビリティエンジニアリング」を読み進めるポッドキャストです。 SRE を今から知りたい方はもちろん、SRE の基礎を改めて学びたい方もぜひ視聴ください。Twitter のハッシュタグは #もう一度読むSRE です。
…
continue reading
24 章 cronによる分散定期スケジューリング から 24.3.1 拡張されたインフラストラクチャ まで
…
continue reading
23.5.3.1 クォーラムの編成 〜 23.7 まとめ
…
continue reading
23.5.3 キャパシティとロードバランシング
…
continue reading
23.5.2 レプリカの配置
…
continue reading
23.5 分散合意ベースのシステムのデプロイ〜 23.5.1 レプリカ数
…
continue reading
23.4.8 ディスクアクセス
…
continue reading
23.4.5 パフォーマンスに関する考察:Fast Paxos から 23.4.7 バッチ処理 まで
…
continue reading
23.4.2 読み取り負荷が大きいワークロードのスケーリングから23.4.4 分散合意のパフォーマンスとネットワークのレイテンシまで
…
continue reading
23.4.1 Multi-Paxos:詳細なメッセージフロー
…
continue reading
23.3.5 信頼性を持つ分散キュー及びメッセージング から 23.4 分散合意のパフォーマンス まで
…
continue reading
23.3.3 リーダー選出を利用する高可用性を持つ処理 から 23.3.4 分散協調及びロックサービス まで
…
continue reading
23.3 分散合意のためのシステムアーキテクチャパターン から 23.3.2 信頼性を持つ複製データストア及び設定ストアまで
…
continue reading
23.2 分散合意の動作 から 23.2.1 Paxosの概要: サンプルプロトコル まで
…
continue reading
23.1 合意を利用する目的:分散システムの協調障害 から 23.1.3 ケーススタディ 3:問題のあるグループメンバーシップアルゴリズム まで
…
continue reading
23章 クリティカルな状態の管理: 信頼性のための分散合意
…
continue reading
SRE NEXT 2023 Chair ぐりもおさん をゲストに迎え、SRENEXTのことをお聞きしました。
…
continue reading
22.6 カスケード障害に対応するためにすぐに行うべき手順 から 22.7まとめまで
…
continue reading
22.4 カスケード障害を引き起こす条件 から 22.5.3 重要度の低いバックエンドのテスト まで
…
continue reading
22.3 起動直後の低パフォーマンスとコールドキャッシュ から 22.3.1 スタックは常に下っていくようにすること まで
…
continue reading
22.2.4 レイテンシとタイムアウト から 22.2.4.4 二峰性のレイテンシ まで
…
continue reading
22.2.2 ロードシェディングとグレースフルデグラデーション から 22.2.3 リトライ まで
…
continue reading
22.1.3 利用できないサービス から 22.2.1 キューの管理 まで
…
continue reading
22章 カスケード障害への対応 から 22.1.2.5 リソース間の依存関係 まで 本編は12分05秒あたりからになります。
…
continue reading
21.7 接続によって生じる負荷 から 21.8 まとめ まで
…
continue reading
21.5 利用率のシグナル から 21.6.1 リトライの判断 まで
…
continue reading
21.3 クライアント側でのスロットリング から 21.4 重要度 まで
…
continue reading
21章 過負荷への対応 から 21.2 顧客単位での制限 まで
…
continue reading
20.4 ロードバランシングのポリシー から 20.4.1.3 マシンのばらつき まで
…
continue reading
20.3.3 サブセット選択のアルゴリズム : 決定的なサブセット選択
…
continue reading
20.3 サブセットの設定によるコネクションプールの制限 から 20.3.2 サブセットの選択アルゴリズム:ランダムなサブセットの選択 まで
…
continue reading
20章 データセンターでのロードバランシング から 20.2.2 不健全なタスクへの確実なアプローチ:レイムダック状態 まで
…
continue reading
19.3 仮想 IP アドレスでのロードバランシング まで
…
continue reading
19章 フロントエンドにおけるロードバランシング から 19.2 DNS を使ったロードバランシング まで
…
continue reading
18.3.5 チームの力学 から 18.5 まとめ まで
…
continue reading
18.3.4 認知の向上と採用の推進 から 18.3.4.4 適切なレベルでの設計 まで
…
continue reading
18.3.2 Auxon の紹介 から 18.3.3.1 近似 まで
…
continue reading
18.2.2 Google におけるソリューション:インテントベースのキャパシティプランニング から 18.3.1.2 パフォーマンスメトリクス まで
…
continue reading
18章 SRE におけるソフトウェアエンジニアリング から 18.2 Auxon のケーススタディ:プロジェクトの背景と問題の領域 まで
…
continue reading
17.3.7 プロダクション環境におけるプローブ から 17.4 まとめ まで
…
continue reading
17.3.6 結合 まで
…
continue reading
17.3.5 予想されるテストの失敗 まで
…
continue reading
17.3.4 プロダクションへのプッシュ
…
continue reading
17.3.2 ディザスタのテスト から 17.3.3 速度の重要性 まで
…
continue reading
17.3 大規模なテスト から 17.3.1 スケーラブルなツールのテスト まで
…
continue reading
17.2 テストの作成と環境の構築 まで
…
continue reading
17.1.2.2 ストレステスト から 17.1.2.3 カナリアテスト まで
…
continue reading
17.1.2 プロダクションテスト から 17.1.2.1 設定テスト まで
…
continue reading
17 信頼性のためのテスト から 17.1 ソフトウェアテストの種類 まで
…
continue reading
16章 サービス障害の追跡 から 16.2.4 予想外のメリット まで
…
continue reading
15章 ポストモーテムの文化: 失敗からの学び から 15.4 まとめと改善の継続 まで
…
continue reading