我们正在寻找一名经验丰富的二级支持工程师(L2 Support Engineer),为在 AWS 虚拟机(VM)上运行的 Windows 和 Linux 操作系统提供高级技术支持。在该岗位中,你将负责处理升级事件、进行深度故障排查、应用操作系统补丁和安全更新,并提升 AWS 的性能与可靠性。你将运用对 AWS 服务及自动化的理解来解决复杂问题,支持灾难恢复工作,并推动运维改进。该职位最适合具备扎实云基础设施与操作系统管理经验的资深专业人士。
**关键职责**
**架构统筹**
– 为 Windows 和 Linux 虚拟机设计、实施并优化 AWS 架构,重点关注性能、安全性和可扩展性。
– 参与 Well-Architected Framework(良好架构框架)评审,并应用建议以提升系统效率。
**复杂故障排查**
– 解决影响 Windows 和 Linux 虚拟机的关键升级问题,包括混合环境、多区域环境,以及存在相互依赖的服务。
– 排查高级 AWS 服务问题,例如 Lambda、API Gateway 配置或 AWS Patch Manager。
– 针对重复或影响较大的事件开展根因分析(RCA),并实施纠正措施。
**系统管理与优化**
– 在 AWS 上对 Windows(例如组策略、注册表调优)和 Linux(例如内核参数、进程优化)执行高级维护。
– 执行并完善 Windows(例如 WSUS)和 Linux(例如 yum/apt)的操作系统补丁工作流,确保合规并尽量减少中断。
– 优化 AWS 中 Windows 与 Linux 系统的整体性能。
**安全与合规**
– 开展安全审计与合规检查(例如 SOC2、GDPR),并修复已识别的漏洞。
– 应用操作系统安全最佳实践(例如 Windows 加固与 Linux SSH 管理)。
**自动化与 DevOps**
– 使用脚本(Bash、Python、PowerShell)与 AWS CLI 自动化运维任务,例如打补丁、扩缩容与监控。
– 使用 Terraform 或 CloudFormation 预置 AWS 资源。
**灾难恢复与高可用**
– 支持高可用配置(例如多可用区部署、多节点/故障切换集群),以保障服务可用性。
**团队协作**
– 为 L1 工程师在复杂事件、打补丁流程以及 AWS 运维方面提供技术支持与指导。
– 参与知识库内容建设,并为 Windows、Linux 以及 AWS 相关任务编写故障排查文档。
**任职要求与技能**
**技术能力**
– 扎实掌握 Windows Server(2016/2019/2022)和/或 Linux 发行版(例如 CentOS、RHEL),包括系统诊断能力。
– 精通 Windows(Windows Update、WSUS)与 Linux(yum、apt)的操作系统打补丁与故障排查。
– 深入理解 AWS 核心服务(EC2、S3、VPC、IAM)及高级服务(Lambda、API Gateway、EKS、CloudWatch)。
– 能够使用脚本(Bash、Python、PowerShell)与 AWS CLI 自动化 AWS 运维工作。
– 有使用 AWS CloudFormation 与 Terraform 进行资源预置与管理的经验。
– 了解 AWS 安全最佳实践、身份与访问管理(IAM 策略)以及网络概念(VPC、子网)。
– 具备容量规划能力,能够评估资源趋势并提出调整建议。
– 具备性能优化能力,能够识别并解决操作系统与 AWS 环境中的瓶颈。
– 有支持复杂迁移与现代化项目的经验。
**软技能**
– 针对复杂技术问题具备出色的问题解决与分析能力。
– 具备良好的沟通能力,能够编写解决方案文档并与团队成员及客户协作。
– 能够在节奏快、以云为导向的环境中独立工作,也能作为团队成员协作完成任务。
– 以客户为中心,能够快速响应并解决升级事件,具备强烈的责任意识。
**经验**
– 4–8 年 IT 支持、系统管理或云运维经验,重点在 Windows/Linux 操作系统管理与 AWS。
– 在排查并解决 AWS 托管的 Windows/Linux 环境复杂问题方面有成熟经验。
**教育背景**
– 计算机科学、信息技术或相关领域学士学位(或同等经验)。
**优先认证(如有则加分)**
– AWS 认证解决方案架构师 – 助理级(Associate)
– AWS 认证 DevOps 工程师 – 专业级(Professional)
– AWS 认证安全 – 专项(Specialty)
– Microsoft 认证:Windows Server 管理(例如 MCSA 等同)
– Linux Professional Institute 认证(LPIC-1)或 Red Hat 认证系统管理员(RHCSA)
**其他要求**
– 愿意在关键事件期间提供值班支持,并在需要时负责补丁与恢复相关工作。
– 熟练使用远程协作工具(例如 Microsoft Teams、Outlook)以及工单系统(例如 ServiceNow、Jira)。
To find out more about this job, please visit this link

