Aprendizaje por refuerzo
El aprendizaje por refuerzo es un paradigma del aprendizaje automático que busca lograr que un agente aprenda por ensayo y error, recompensando los comportamientos deseados y castigando los indeseados. El aprendizaje por refuerzo es uno de los tres paradigmas principales del aprendizaje automático, junto con el aprendizaje supervisado y el aprendizaje no supervisado.
aprendizaje automático • aprendizaje no supervisado • aprendizaje por refuerzo profundo • aprendizaje profundo • aprendizaje supervisado