Google DeepMind WARM es un acrónimo de aprendizaje por refuerzo ponderado y dirigido sin modelo a partir de retroalimentación humana, que se refiere a un algoritmo de aprendizaje automático que aprende e imita los comportamientos de expertos humanos a través de técnicas de aprendizaje por refuerzo.