Artwork

コンテンツは Mathieu Sanchez によって提供されます。エピソード、グラフィック、ポッドキャストの説明を含むすべてのポッドキャスト コンテンツは、Mathieu Sanchez またはそのポッドキャスト プラットフォーム パートナーによって直接アップロードされ、提供されます。誰かがあなたの著作物をあなたの許可なく使用していると思われる場合は、ここで概説されているプロセスに従うことができますhttps://ja.player.fm/legal
Player FM -ポッドキャストアプリ
Player FMアプリでオフラインにしPlayer FMう!

#18 - Natalie Godec - Mettre AWS en PLS

59:57
 
シェア
 

Manage episode 431765283 series 3590017
コンテンツは Mathieu Sanchez によって提供されます。エピソード、グラフィック、ポッドキャストの説明を含むすべてのポッドキャスト コンテンツは、Mathieu Sanchez またはそのポッドキャスト プラットフォーム パートナーによって直接アップロードされ、提供されます。誰かがあなたの著作物をあなたの許可なく使用していると思われる場合は、ここで概説されているプロセスに従うことができますhttps://ja.player.fm/legal

Rares sont ceux qui peuvent se vanter d’avoir “cassé” AWS 🏚️

Cette tech fait partie de ce club très fermé.

Cela fait plusieurs mois que Natalie et son équipe en ont ras-le-bol de gérer les incidents Kafka…

Kafka, c’est ce qu’on appelle un “message broker” ou “bus d’évènements”.

Pour faire simple, c’est un intermédiaire entre vos applis (vos “services”).

En gros, quand un service A veut parler à un service B, il a 2 choix :

- soit il lui parle en direct… Mais il faut que service B soit prêt et dispo.

- soit il envoie un message à Kafka, qui le garde au chaud, jusqu’à ce que le service B se décide à écouter

Bref.

C’est plein de vertus mais j’en parlerai une autre fois.

C’est surtout souvent TRÈS central dans l’infra.

Et quand ça tombe, plus personne ne peut se parler et donc… Ca pique.

Bon, maintenant revenons à nos moutons. 🐑

Natalie n’en peut plus de gérer elle-même son Kafka, qui lui fait des misères.

Alors elle décide de déléguer ça à Amazon, via leur offre Amazon “MSK” (”Manage Streaming for Kafka”).

”Je s’occupe de tout, tu s’occupes de rien.” te dit Jeff Bezos.

Et…

C’est plutôt vrai.

Pendant plusieurs mois, la vie est belle.

Jusqu’au jour où…

Il faut changer une simple configuration.

Un tout petit paramètre de rien du tout.

5 minutes plus tard, plus rien ne marche.

Kafka ne répond plus.

Impossible de se connecter, même avec ce bon vieux telnet 🤔

C’est le moment d’employer les grand moyens.

La fameuse “méthode devops”. 🪄

On redémarre.

Sauf que ben… ça redémarre pas.

Et comme c’est Amazon qui gère…

On peut pas faire grand chose d’autre. 🤷

Le cluster MSK est cassé.

Et bien sûr, toute la prod avec. 😱

Alors comment Natalie Godec s’est-elle sortie de cette situation ?

Vous le saurez en écoutant ce nouvel épisode de Tronche de Tech 🎙️

Un petit voyage dans le monde de l’infra à ne pas manquer !

Bonne écoute 🎙️

PS : dites-nous ce que vous pensez de l'épisode en commentaire (et surtout, abonnez-vous !)

-----------------------------------

Natalie Godec est Senior Cloud Architect chez Zencore.

Vous pouvez la retrouver sur :

- Twitter https://twitter.com/ouvessvit

- Youtube : https://www.youtube.com/channel/UCvrKGfYlJpAjdzT1qazyaiw

- Linkedin : https://www.linkedin.com/in/natalie-godec

L'article de blog sur l'incident MSK https://aws.plainenglish.io/how-we-broke-our-aws-msk-cluster-7b0a62ccbe53

---------------------------------

Je suis Mathieu Sanchez, CTO d'Acasi, et pour me suivre, c'est principalement sur Linkedin : https://www.linkedin.com/in/matsanchez/

Vous pouvez aussi suivre Tronche de Tech, sur vos réseaux favoris :

- Linkedin : https://www.linkedin.com/company/tronche-de-tech/

- Instagram : https://www.instagram.com/tronchedetech/

- TikTok : https://www.tiktok.com/@tronchedetech

- Twitter : https://twitter.com/TroncheDeTech



Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

  continue reading

39 つのエピソード

Artwork
iconシェア
 
Manage episode 431765283 series 3590017
コンテンツは Mathieu Sanchez によって提供されます。エピソード、グラフィック、ポッドキャストの説明を含むすべてのポッドキャスト コンテンツは、Mathieu Sanchez またはそのポッドキャスト プラットフォーム パートナーによって直接アップロードされ、提供されます。誰かがあなたの著作物をあなたの許可なく使用していると思われる場合は、ここで概説されているプロセスに従うことができますhttps://ja.player.fm/legal

Rares sont ceux qui peuvent se vanter d’avoir “cassé” AWS 🏚️

Cette tech fait partie de ce club très fermé.

Cela fait plusieurs mois que Natalie et son équipe en ont ras-le-bol de gérer les incidents Kafka…

Kafka, c’est ce qu’on appelle un “message broker” ou “bus d’évènements”.

Pour faire simple, c’est un intermédiaire entre vos applis (vos “services”).

En gros, quand un service A veut parler à un service B, il a 2 choix :

- soit il lui parle en direct… Mais il faut que service B soit prêt et dispo.

- soit il envoie un message à Kafka, qui le garde au chaud, jusqu’à ce que le service B se décide à écouter

Bref.

C’est plein de vertus mais j’en parlerai une autre fois.

C’est surtout souvent TRÈS central dans l’infra.

Et quand ça tombe, plus personne ne peut se parler et donc… Ca pique.

Bon, maintenant revenons à nos moutons. 🐑

Natalie n’en peut plus de gérer elle-même son Kafka, qui lui fait des misères.

Alors elle décide de déléguer ça à Amazon, via leur offre Amazon “MSK” (”Manage Streaming for Kafka”).

”Je s’occupe de tout, tu s’occupes de rien.” te dit Jeff Bezos.

Et…

C’est plutôt vrai.

Pendant plusieurs mois, la vie est belle.

Jusqu’au jour où…

Il faut changer une simple configuration.

Un tout petit paramètre de rien du tout.

5 minutes plus tard, plus rien ne marche.

Kafka ne répond plus.

Impossible de se connecter, même avec ce bon vieux telnet 🤔

C’est le moment d’employer les grand moyens.

La fameuse “méthode devops”. 🪄

On redémarre.

Sauf que ben… ça redémarre pas.

Et comme c’est Amazon qui gère…

On peut pas faire grand chose d’autre. 🤷

Le cluster MSK est cassé.

Et bien sûr, toute la prod avec. 😱

Alors comment Natalie Godec s’est-elle sortie de cette situation ?

Vous le saurez en écoutant ce nouvel épisode de Tronche de Tech 🎙️

Un petit voyage dans le monde de l’infra à ne pas manquer !

Bonne écoute 🎙️

PS : dites-nous ce que vous pensez de l'épisode en commentaire (et surtout, abonnez-vous !)

-----------------------------------

Natalie Godec est Senior Cloud Architect chez Zencore.

Vous pouvez la retrouver sur :

- Twitter https://twitter.com/ouvessvit

- Youtube : https://www.youtube.com/channel/UCvrKGfYlJpAjdzT1qazyaiw

- Linkedin : https://www.linkedin.com/in/natalie-godec

L'article de blog sur l'incident MSK https://aws.plainenglish.io/how-we-broke-our-aws-msk-cluster-7b0a62ccbe53

---------------------------------

Je suis Mathieu Sanchez, CTO d'Acasi, et pour me suivre, c'est principalement sur Linkedin : https://www.linkedin.com/in/matsanchez/

Vous pouvez aussi suivre Tronche de Tech, sur vos réseaux favoris :

- Linkedin : https://www.linkedin.com/company/tronche-de-tech/

- Instagram : https://www.instagram.com/tronchedetech/

- TikTok : https://www.tiktok.com/@tronchedetech

- Twitter : https://twitter.com/TroncheDeTech



Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

  continue reading

39 つのエピソード

すべてのエピソード

×
 
Loading …

プレーヤーFMへようこそ!

Player FMは今からすぐに楽しめるために高品質のポッドキャストをウェブでスキャンしています。 これは最高のポッドキャストアプリで、Android、iPhone、そしてWebで動作します。 全ての端末で購読を同期するためにサインアップしてください。

 

クイックリファレンスガイド

探検しながらこの番組を聞いてください
再生