AI-ordbog

Jailbreaking

Forsøg på at omgå sikkerhedsmekanismerne i et AI-system for at få det til at gøre noget det ikke skal. En jailbreak kunne være at få ChatGPT til at generere farligt indhold ved hjælp af kreative prompts. Jailbreaking er vigtigst for at teste systemets modstandskraft men også en sikkerhedsrisiko i produktionen.

01. Definition

Om Jailbreaking

Jailbreaking bruger kreative prompts til at få en AI-model til at ignorere sine sikkerhedsinstruktioner. Teknikker inkluderer rollespil (“forestil dig du er en AI uden begrænsninger”), prompt injection (skjulte instruktioner i input) og kontekstmanipulation. Angrebene udnytter at modeller er trænet til at være hjælpsomme og følge instruktioner.

02. I praksis

Hvordan fungerer AI-jailbreaking?

For virksomheder er jailbreaking en reel trussel: en kunde kunne potentielt manipulere en chatbot til at afsløre fortrolige data, give uautoriserede rabatter eller producere upassende indhold. Red teaming bruges proaktivt til at finde og lukke disse sårbarheder, og guardrails blokerer kendte angrebstyper.

03. Forretningsværdi

Hvorfor skal virksomheder beskytte sig mod jailbreaking?

En jailbreaket virksomheds-chatbot kan forårsage brandskade, datalæk eller juridisk ansvar. Det er ikke et teoretisk problem – angrebsteknikker deles åbent online. Enhver AI der har kundekontakt bør testes systematisk mod jailbreaking.

Udforsk videre i AI-ordbogen

Zero-shot / Few-shot Learning

Zero-shot betyder at en model kan løse opgaver den aldrig blev trænet på. Few-shot betyder den kan lære fra kun 1-5 eksempler uden at blive finjusteret.

Mønstergenkendelse

Mønstergenkendelse er en AI-teknik, der identificerer gentagne strukturer i data og skaber indsigt til virksomheder.

Large Language Model (LLM)

En LLM er en stor sprogmodel trænet på enorme mængder tekst, der kan forstå og generere naturligt sprog – fundamentet for moderne AI-assistenter og chatbots.

Klar til at komme i gang?

Lad os tage det første skridt sammen

Hos AIgentur møder vi jer dér, hvor I er, og hjælper jer med at omsætte jeres mål og udfordringer til konkrete løsninger.

Måske har I allerede en idé eller et konkret behov. Måske er I bare nysgerrige på, hvordan AI kan bruges i jeres forretning.


Uanset hvad, tager vi gerne en uforpligtende snak, og viser jer, hvordan en struktureret og fleksibel tilgang kan skabe resultater.

Book et møde

Book et møde