Mlops engineer für ci / cd & inference services (m/w/d)
HannoverFinanz Informatik GmbH amp; Co. KG
...Kubernetes mit dem Spark Operator betrieben werden - idealerweise mit Fokus auf verteilte Inferenz oder Preprocessing großer Datenmengen. Bereitstellung von unimodalen (z.B. LLM, OCR, SST/TTS) und multimodalen KI-Modellen mittels Nvidia Triton, NIM oder Alternativen wie Huggingface TGI, TEI oder vLLM. Steuerung der [...]
Kategorie IT / Informationstechnologie