Vendredi, des chercheurs de Nvidia, UPenn, Caltech et de l’Université du Texas à Austin ont annoncé Eureka, un algorithme qui utilise le modèle de langage GPT-4 d’OpenAI pour concevoir des objectifs d’entraînement (appelés « fonctions de récompense ») afin d’améliorer la dextérité des robots. Le travail vise à combler le […]