Google DeepMind WARM é um acrônimo para aprendizado por reforço ponderado e direcionado, livre de modelo e a partir de feedback humano, que se refere a um algoritmo de aprendizado de máquina que aprende e imita comportamentos de especialistas humanos por meio de técnicas de aprendizado por reforço.