Sr. Site Reliability Engineer - Technical Incident Manager

Dylan Bochman
Sr. Site Reliability Engineer - Technical Incident Manager

Specializing in Reliability, Resilience, and Incident Management, with experience spanning SRE and Product Management at Nvidia, Groq, HashiCorp, and Spotify. Focused on enhancing service availability and streamlining operations in complex AI and cloud environments.

Email LinkedIn GitHub

Remote

Currently Employed

Career Goals

I'm currently at Nvidia, where I'm applying my resilience expertise and incident management skills to build operational resilience for AI inference infrastructure. My goal remains to empower engineers, drive operational excellence, and cultivate collaborative, blameless engineering cultures.

Core Expertise

Let's Connect

Interested in discussing on-call tooling, challenging incidents, or potential opportunities?

Request Resume LinkedIn

Dylan BochmanSr. Site Reliability Engineer - Technical Incident Manager

Professional ExperienceIncident Management @ Nvidia · Previously Groq, HashiCorp & Spotify · 7+ years scaling reliability

Professional Experience

Career Goals

Core Expertise

Technical Skills

Let's Connect

Dylan Bochman
Sr. Site Reliability Engineer - Technical Incident Manager