Google DeepMind WARMは、人間のフィードバックからの重み付けおよび指向性モデルフリー強化学習の頭字語であり、強化学習技術を通じて人間の専門家の行動から学習し模倣する機械学習アルゴリズムを指します。