Aprendizaje por refuerzo

El aprendizaje por refuerzo es un paradigma del aprendizaje automático que busca lograr que un agente aprenda por ensayo y error, recompensando los comportamientos deseados y castigando los indeseados. El aprendizaje por refuerzo es uno de los tres paradigmas principales del aprendizaje automático, junto con el aprendizaje supervisado y el aprendizaje no supervisado.

Entradas relacionadas

aprendizaje automáticoaprendizaje no supervisadoaprendizaje por refuerzo profundoaprendizaje profundoaprendizaje supervisado