資深 SRE 工程師

Moledao

面議
远程办公5 - 10 年經驗本科全職
分享

遠程工作詳情

工作開放國家全球

語言要求英語

職位描述

顯示原文

摘要

我們正在尋找一位資深SRE工程師(專注於錢包運營),以確保我們在AWS上核心業務基礎設施的穩定性、可用性與效能。此角色將負責管理全球生產環境、構建可擴展且高可用的系統、實施自動化與可觀測性平台,以及維護安全性與合規標準。


職位目的

  • 負責部署流程
  • 確保系統可靠、高效且具規模化運行
  • 構建工具以提升正常運行時間、性能與事件響應能力


工作職責

  • 確保AWS上支撐核心業務運營的全球基礎設施之穩定性、可用性與效能,並對生產SLA負責
  • 設計、運維及排查雲原生元件,如 Kubernetes、Envoy、服務網格(Istio/Linkerd)及 Ingress 控制器
  • 透過自動化與平台工具(基礎設施即程式碼、CI/CD)提升運營效率,實現系統可觀測性、自癒能力與快速故障恢復
  • 實施並維護運維安全最佳實踐,包括存取控制(AWS IAM/K8s RBAC)、網路安全策略、漏洞管理與事件響應
  • 構建並優化全球化運營系統,包括容量規劃、監控與告警(Prometheus/ELK)、CI/CD 流水線(GitLab/Jenkins)、災難恢復及自動故障恢復
  • 深入理解業務架構,參與高可用性與災難恢復方案的設計,並持續進行成本優化


資格要求

  • 5 年以上 Linux 運維、SRE 或 DevOps 經驗,擅長管理大規模分散式系統
  • 精通 AWS 核心服務(EC2、S3、VPC、IAM、ELB、RDS 等),具有架構設計、運維與成本優化經驗
  • 深入理解 Kubernetes 架構,包括管理、排查及效能調優大規模生產集群
  • 熟悉 Envoy、Istio/Linkerd 服務網格或 Nginx/Ingress 控制器的 L7 流量管理
  • 具備強烈的運維安全意識與實踐經驗,熟悉常見 OS、網路及應用安全漏洞與緩解措施
  • 精通至少一種程式語言(Go/Python/Shell),以實現運維自動化解決方案
  • 擁有使用 Prometheus 及 ELK 等可觀測性堆疊構建高效監控平台的豐富經驗
  • 具備容量規劃及性能測試經驗,能量化系統瓶頸並制定相應規劃


優先條件

  • 具有管理 SRE/工具/平台團隊經驗
  • 熟悉 Prometheus、Grafana 及 ELK 等可觀測性堆疊
  • 擁有 AWS(SAA/SAP)、Kubernetes(CKA/CKE/CKS)等專業認證者優先


Preview

Dorothy Mole

HR OfficerMoledao

今天回覆 6 次

發布於 23 December 2025

Moledao

少於50人

DAO

查看熱招工作

舉報

Bossjob安全提醒

若該職位需要您出國工作,請提高警惕,並小心詐騙。

如果您在求職過程中遇到雇主有以下行為, 請立即檢舉

  • 扣留您的身分證件,
  • 要求您提供擔保或收取財產,
  • 迫使您投資或籌集資金,
  • 收取非法利益,
  • 或其他違法情形。
Tips
×

Some of our features may not work properly on your device.

If you are using a mobile device, please use a desktop browser to access our website.

Or use our app: Download App