第廿六、廿八章
- 導讀時間:2018/04/26 (四)
- 場地提供:PIXNET
- 章節內容:
- 第 26 章 資料完整性 by jnlin
- 第 28 章 迅速培養 SRE 加入 on-call by Winnie
- 共筆紀錄
導讀整理
Chapter 26 資料完整性
Chapter 28 Accelerating SREs to On-Call and Beyond
討論與分享
- 原始討論連結
- 問題提問 by 正瑋
- Ch 26 - Data Integrity: What You Read Is What You Wrote
- Q: 如何確保「資料完整性」(Data Integrity)?
- Q: ACID 與 BASE 請選擇?有哪些需注意的關鍵點?
- Q: 你們目前的備份及復原計劃為何?
- Q: 續上,備份保存多久?需要多久時間才能復原?能還原多早之前的資料?能還原到多細緻?能允許損失多少資料?願意投資多少資源在備份及復原機制?
- Q: 續上,復原動作需要多少人工介入?自動化程度?
- Q: soft deletion、backups、archives、snapshot 與 replication,請選擇?有哪些需注意的關鍵點?
- Q: 遇到 TB、PB 等級的資料備份及復原,該怎麼做?
- Q: Out-of-band data validation 你們有類似的機制來協助驗證資料的完整、正確性嗎?
- Q: 可以分享你所遭遇過的資料遺漏或任何影響了「資料完整性」的事故?
- Q: 你們是否有進行「資料遺漏」的災後還原訓練?
- Ch 28 - Accelerating SREs to On-Call and Beyond
- Q: 如何評估新手已準備好能承擔 on-call 職務?
- Q: 如何能夠放心的讓新手負責 on-call 職務?
- Q: 你們公司有 on-call 制度嗎?是如何運作的?
- Q: 你們有針對 on-call 人員的教育訓練嗎?
- Q: 如何建立持續學習的文化?
- Q: 除了表 28-1、圖 28-1 的內容之外,針對培養 SRE on-call 人員這件事,你覺得還可以補充哪些項目?
- Q: 如何讓新人加入(融入)團隊,包含文化層面、工作流程面⋯⋯
- Q: 如何從「決策陷阱」中抽身?如何培養此種能力?
- Q: 如何培養「逆向工程」、「統計學/科學方法」、「隨機應變」能力?
- Q: 透過逆向工程來學習,有人有這方面的經驗嗎?
- Q: 你們有「事後檢討」的制度嗎?這些事後檢討報告能夠作為學習材料嗎?
- Q: SRE 人員應該具備哪些特質?
- Q: 你們有額外的培訓環境嗎? 會複製/模擬真實流量的情境嗎?