
Aufgabenbereich Die Abteilung Site Reliability Engineering betreibt alle IONOS Cloud IaaS und PaaS Services. Wir sind ein Team von hochklassigen und erfahrenen Ingenieuren, die komplexe Probleme lösen sollen. - Überwachst die Systemleistung (Betriebszeit, Latenz, Fehlerraten) und leistest die 24/7-Störungsbehebung mit dem Ziel, 85 % der Probleme auf Anhieb zu lösen. - Planen und Ausführen nahtloser Software-/Hardware-Implementierungen über mehrere Rechenzentren hinweg. - Durchführung regelmäßiger Disaster-Recovery-Übungen und Verbesserung von Runbooks, Warnungen und Überwachungsschwellenwerten. - Erforschung, Bewertung und Empfehlung von Lösungen zur Verbesserung von Zuverlässigkeit, Verfügbarkeit, Leistung und Sicherheit. - Automatisieren sich wiederholender Aufgaben zur Verbesserung der Effizienz. - Bereitstellung von Level-2-Support und direktem Kundenkontakt. Qualifikationen - Beherrschung der Linux-Systemadministration mit guten Fähigkeiten zur Fehlerbehebung. - Du hast Erfahrung mit virtualisierten Umgebungen, einschließlich Qemu/KVM, OpenStack, Proxmox und Kubernetes (K8s). - Du hast Erfahrung mit Konfigurationsmanagement-Tools wie SaltStack oder Ansible sowie mit Monitoring-Tools wie Prometheus, Loki und Grafana. - Erfahrung mit Code-Management ist erforderlich, wobei Kenntnisse über Merge-Konflikte, Feature-Zweige, Merge-Requests und kontinuierliche Integration (CI/CD) ein Plus sind. - Bevorzugte Qualifikation: Erfahrung mit Ceph und Software-definierten Netzwerken. - Englisch und Deutsch B2+ Nice to have: - Erfahrung mit bewährten Verfahren der Softwaretechnik, einschließlich Codeüberprüfungen, Build-Prozesse, Paketierung und Tests. - Vertrautheit mit dem ITIL-Rahmen. Hinweis: Zum Ende des Bewerbungsprozesses müssen Kandidaten einer Sicherheitsüberprüfung unterzogen werden. Dein Einverständnis dafür wird rechtzeitig im Prozess erfragt. Benefits - Hybrides Arbeitsmodell mit Homeoffice-Möglichkeit. - Flexible Arbeitszeiten durch Vertrauensarbeitszeit. - An einigen Standorten eine bezuschusste Kantine und verschiedene kostenfreie Getränke. - Moderne Büroflächen mit sehr guter Verkehrsanbindung. - Diverse Mitarbeiterrabatte für Aktivitäten und Produkte. - Mitarbeiterevents wie Sommer- und Winterfeiern, sowie Workshops. - Zahlreiche Weiterbildungs- und Entwicklungsmöglichkeiten. - Verschiedene Gesundheitsangebote, wie Sport- und Gesundheitskurse. Kennziffer: 851
Hinterm Hauptbahnhof 3-5
76137
IONOS SE, Hinterm Hauptbahnhof 3-5, 76137 Karlsruhe, Baden, Deutschland, Baden-Württemberg
Postuler via
Karlsruhe
Aufgabenbereich
Die Abteilung Site Reliability Engineering betreibt alle IONOS Cloud IaaS und PaaS Services. Wir sind ein Team von hochklassigen und erfahrenen Ingenieuren, die komplexe Probleme lösen sollen.
- Überwachst die Systemleistung (Betriebszeit, Latenz, Fehlerraten) und leistest die 24/7-Störungsbehebung mit dem Ziel, 85 % der Probleme auf Anhieb zu lösen.
- Planen und Ausführen nahtloser Software-/Hardware-Implementierungen über mehrere Rechenzentren hinweg.
- Durchführung regelmäßiger Disaster-Recovery-Übungen und Verbesserung von Runbooks, Warnungen und Überwachungsschwellenwerten.
- Erforschung, Bewertung und Empfehlung von Lösungen zur Verbesserung von Zuverlässigkeit, Verfügbarkeit, Leistung und Sicherheit.
- Automatisieren sich wiederholender Aufgaben zur Verbesserung der Effizienz.
- Bereitstellung von Level-2-Support und direktem Kundenkontakt.
Qualifikationen
- Beherrschung der Linux-Systemadministration mit guten Fähigkeiten zur Fehlerbehebung.
- Du hast Erfahrung mit virtualisierten Umgebungen, einschließlich Qemu/KVM, OpenStack, Proxmox und Kubernetes (K8s).
- Du hast Erfahrung mit Konfigurationsmanagement-Tools wie SaltStack oder Ansible sowie mit Monitoring-Tools wie Prometheus, Loki und Grafana.
- Erfahrung mit Code-Management ist erforderlich, wobei Kenntnisse über Merge-Konflikte, Feature-Zweige, Merge-Requests und kontinuierliche Integration (CI/CD) ein Plus sind.
- Bevorzugte Qualifikation: Erfahrung mit Ceph und Software-definierten Netzwerken.
- Englisch und Deutsch B2+
Nice to have:
- Erfahrung mit bewährten Verfahren der Softwaretechnik, einschließlich Codeüberprüfungen, Build-Prozesse, Paketierung und Tests.
- Vertrautheit mit dem ITIL-Rahmen.
Hinweis: Zum Ende des Bewerbungsprozesses müssen Kandidaten einer Sicherheitsüberprüfung unterzogen werden. Dein Einverständnis dafür wird rechtzeitig im Prozess erfragt.
Benefits
- Hybrides Arbeitsmodell mit Homeoffice-Möglichkeit.
- Flexible Arbeitszeiten durch Vertrauensarbeitszeit.
- An einigen Standorten eine bezuschusste Kantine und verschiedene kostenfreie Getränke.
- Moderne Büroflächen mit sehr guter Verkehrsanbindung.
- Diverse Mitarbeiterrabatte für Aktivitäten und Produkte.
- Mitarbeiterevents wie Sommer- und Winterfeiern, sowie Workshops.
- Zahlreiche Weiterbildungs- und Entwicklungsmöglichkeiten.
- Verschiedene Gesundheitsangebote, wie Sport- und Gesundheitskurse.
Kennziffer: 851
Karlsruhe
Aufgabenbereich
- Bereitstellung, Betrieb und Migration verteilter, hochverfügbarer Dienste unter Linux.
- Verbesserung und Entwicklung des gesamten Stacks, von der Hardware über das Betriebssystem bis zur Anwendung, einschließlich Konfigurationsmanagement und Monitoring.
- Entwicklung und Anpassung von DIM (github.com/ionos-cloud/dim), monzero (github.com/ionos-cloud/monzero) und anderen Open-Source-Projekten.
- Unterstützung unserer Systemadministratoren bei der Automatisierung von Betriebsaufgaben und Rollouts, Bereitstellung von Schnittstellen zur Integration in unsere Hosting-Produkte für andere Teams.
- Administration und Troubleshooting unserer hochverfügbaren und komplexen Infrastruktur, einschließlich der Teilnahme an einer Bereitschaftsrotation.
- Unterstützung der Unternehmensziele durch eine effiziente Betriebsarchitektur, aktives Lifecycle Management und schlanke Prozesse in einer agilen DevOps-Umgebung, Betrieb einer zertifizierten, sicherheitsrelevanten Infrastruktur.
Qualifikationen
Du hast Informatik studiert oder eine vergleichbare Ausbildung abgeschlossen. Du hast ein ausgeprägtes Interesse an Infrastrukturthemen, gute Netzwerkkenntnisse und bringst folgende Qualifikationen mit:
- Mindestens 5 Jahre praktische Erfahrung in der Administration komplexer Dienste unter Linux (keine spezielle Distribution).
- Infrastructure as Code und Automatisierung sind wichtige Bestandteile Ihrer Arbeitsweise, Du bist wie wir ein Fan von Open Source, insbesondere Linux.
- Mehrjährige Erfahrung in der systemnahen Entwicklung von hochverfügbaren Software-Artefakten, geschrieben in Programmier- oder Skriptsprachen wie Go, Python, Bash und Java.
- Praktische Erfahrung im Betrieb von DNS (PowerDNS, PowerDNS Recursor, dnsdist), NTP (ntpd, chrony, Meinberg), DHCP und IP-Management.
- Observability Stacks (z.B. collectd/telegraf, metrictank, influx, Grafana), Erfahrung mit iBGP und eBGP, Anycast Routing und ECMP.
- Fähigkeit, fließend in Englisch mit einem internationalen Team zu kommunizieren, Deutschkenntnisse sind von Vorteil.
Benefits
- Hybrides Arbeitsmodell mit Homeoffice-Möglichkeit.
- Flexible Arbeitszeiten durch Vertrauensarbeitszeit.
- An einigen Standorten eine bezuschusste Kantine und verschiedene kostenfreie Getränke.
- Moderne Büroflächen mit sehr guter Verkehrsanbindung.
- Diverse Mitarbeiterrabatte für Aktivitäten und Produkte.
- Mitarbeiterevents wie Sommer- und Winterfeiern, sowie Workshops.
- Zahlreiche Weiterbildungs- und Entwicklungsmöglichkeiten.
- Verschiedene Gesundheitsangebote, wie Sport- und Gesundheitskurse.
Kennziffer: 746