Livre blanc

Le piège B+ : comment l'IA comprime le spectre créatif

Les systèmes d'IA formés par RLHF sont systématiquement récompensés pour produire des résultats qui obtiennent un bon score en termes de préférence humaine moyenne, ce qui les pousse mathématiquement vers la médiocrité créative. Cet article définit le piège B+, identifie RLHF comme le mécanisme structurel et propose un cadre Rebel AI basé sur la recherche de nouveauté, des agents divergents antagonistes et un retour d'information métacognitif.

DOI :
10.13140/RG.2.2.10486.46403
Auteur :
Fabio Lauria
Il s'agit d'un texte à l'intérieur d'un bloc div.

Titre de la publication