Google DeepMind WARM est un acronyme qui signifie apprentissage par renforcement pondéré et dirigé sans modèle à partir des retours humains, ce qui fait référence à un algorithme d'apprentissage automatique qui apprend et imite les comportements d'experts humains grâce à des techniques d'apprentissage par renforcement.