跳轉到

第廿六、廿八章

  • 導讀時間:2018/04/26 (四)
  • 場地提供:PIXNET
  • 章節內容:
    • 第 26 章 資料完整性 by jnlin
    • 第 28 章 迅速培養 SRE 加入 on-call by Winnie
  • 共筆紀錄

導讀整理

Chapter 26 資料完整性

Chapter 28 Accelerating SREs to On-Call and Beyond


討論與分享

  • 原始討論連結
  • 問題提問 by 正瑋
    • Ch 26 - Data Integrity: What You Read Is What You Wrote
      • Q: 如何確保「資料完整性」(Data Integrity)?
      • Q: ACID 與 BASE 請選擇?有哪些需注意的關鍵點?
      • Q: 你們目前的備份及復原計劃為何?
      • Q: 續上,備份保存多久?需要多久時間才能復原?能還原多早之前的資料?能還原到多細緻?能允許損失多少資料?願意投資多少資源在備份及復原機制?
      • Q: 續上,復原動作需要多少人工介入?自動化程度?
      • Q: soft deletion、backups、archives、snapshot 與 replication,請選擇?有哪些需注意的關鍵點?
      • Q: 遇到 TB、PB 等級的資料備份及復原,該怎麼做?
      • Q: Out-of-band data validation 你們有類似的機制來協助驗證資料的完整、正確性嗎?
      • Q: 可以分享你所遭遇過的資料遺漏或任何影響了「資料完整性」的事故?
      • Q: 你們是否有進行「資料遺漏」的災後還原訓練?
    • Ch 28 - Accelerating SREs to On-Call and Beyond
      • Q: 如何評估新手已準備好能承擔 on-call 職務?
      • Q: 如何能夠放心的讓新手負責 on-call 職務?
      • Q: 你們公司有 on-call 制度嗎?是如何運作的?
      • Q: 你們有針對 on-call 人員的教育訓練嗎?
      • Q: 如何建立持續學習的文化?
      • Q: 除了表 28-1、圖 28-1 的內容之外,針對培養 SRE on-call 人員這件事,你覺得還可以補充哪些項目?
      • Q: 如何讓新人加入(融入)團隊,包含文化層面、工作流程面⋯⋯
      • Q: 如何從「決策陷阱」中抽身?如何培養此種能力?
      • Q: 如何培養「逆向工程」、「統計學/科學方法」、「隨機應變」能力?
      • Q: 透過逆向工程來學習,有人有這方面的經驗嗎?
      • Q: 你們有「事後檢討」的制度嗎?這些事後檢討報告能夠作為學習材料嗎?
      • Q: SRE 人員應該具備哪些特質?
      • Q: 你們有額外的培訓環境嗎? 會複製/模擬真實流量的情境嗎?