AI-ordbog

RLHF (Reinforcement Learning from Human Feedback)

Træningsmetode hvor mennesker vurderer AI-outputter som gode eller dårlige og systemet justeres baseret på feedback. Det gør AI-modeller brugervenlige og holder dem på linje med menneskelige værdier. OpenAI brugte RLHF til at gøre ChatGPT brugbar i stedet for blot smart.

01. Definition

Om RLHF

RLHF-processen har tre trin: Først genererer modellen flere svar til samme spørgsmål. Derefter rangerer mennesker svarene fra bedst til dårligst. Til sidst trænes modellen via reinforcement learning til at foretrække de svar menneskerne foretrak. Over mange runder bliver modellen stadig bedre til at give svar der er hjælpsomme, korrekte og sikre.

02. I praksis

Hvordan fungerer RLHF?

RLHF er grunden til at ChatGPT kan føre en naturlig samtale i stedet for blot at producere rå tekst. Uden RLHF ville modellen generere grammatisk korrekt men ofte uhjælpsom eller upassende tekst. Virksomheder der fine-tuner modeller bruger lignende teknikker for at tilpasse AI-adfærd til specifikke retningslinjer.

03. Forretningsværdi

Hvorfor er RLHF vigtig?

RLHF er den teknologi der gør AI brugbar for almindelige mennesker. Den sikrer at modeller er hjælpsomme, ærlige og sikre – tre egenskaber der er afgørende for enhver virksomheds AI-implementering. RLHF er også nøglen til alignment af AI-systemer.

Udforsk videre i AI-ordbogen

Red Teaming

Systematisk test af et AI-system ved at lede efter måder at bryde det eller få det til at gøre noget skadefuldt. Red teamers prøver jailbreaks, fodrer det med modsigelse eller forsøger at få det til at være partisk.

Active Learning

Active learning er en maskinlæringsteknik, hvor AI-modellen selv udvælger de mest usikre datapunkter til mærkning – og opnår bedre resultate

RAG (Retrieval-Augmented Generation)

RAG (Retrieval-Augmented Generation) kombinerer søgning i dokumenter med generativ AI for præcise og faktuelle svar.

Klar til at komme i gang?

Lad os tage det første skridt sammen

Hos AIgentur møder vi jer dér, hvor I er, og hjælper jer med at omsætte jeres mål og udfordringer til konkrete løsninger.

Måske har I allerede en idé eller et konkret behov. Måske er I bare nysgerrige på, hvordan AI kan bruges i jeres forretning.


Uanset hvad, tager vi gerne en uforpligtende snak, og viser jer, hvordan en struktureret og fleksibel tilgang kan skabe resultater.

Book et møde

Book et møde