Google DeepMind WARM ist ein Akronym, das für „weighted and directed model-free reinforcement learning from human feedback“ steht und sich auf einen Algorithmus des maschinellen Lernens bezieht, der aus menschlichem Expertenverhalten lernt und dieses durch Techniken des bestärkenden Lernens nachahmt.