Steg 3 av 10 ⏱️ 5 min

Stora språkmodeller (LLM)

Tekniken bakom ChatGPT och Claude - hur de förstår och genererar text.

Vad är en LLM?

Large Language Models (LLM) är neurala nätverk tränade på enorma mängder text för att förstå och generera språk.

Tänk autofyll i mobilen - fast på steroider. Du vet hur telefonen föreslår nästa ord när du skriver? LLM:er gör exakt samma sak, fast med hela meningar, stycken och dokument. Från den enkla uppgiften att gissa nästa ord uppstår förmågan att skriva, resonera och lösa problem.

Transformer-arkitekturen

Alla moderna LLM:er bygger på Transformer-arkitekturen från 2017. Nyckelkomponenter:

Self-Attention: Modellen kan fokusera på relevanta delar av texten, oavsett avstånd
Parallell bearbetning: Hela texten bearbetas samtidigt, inte ord för ord
Skalbarhet: Prestanda ökar med mer data och större modeller

Viktig terminologi

🧩 Tokens

AI läser inte ord som vi gör - den bryter ner text i små bitar, ungefär som stavelser. "Fantastiskt" blir typ ["Fan", "tast", "iskt"]. Fler tokens = längre text som AI:n kan hantera.

📊 Parametrar

Vikterna i modellen. GPT-4 har uppskattningsvis 1.8 biljoner parametrar. Fler = mer kapacitet.

🌡️ Temperatur

Styr kreativitet. Låg (0) = deterministiskt. Hög (1+) = mer slumpmässigt och kreativt.

📏 Kontextfönster

Hur mycket text modellen "minns" i en konversation. Claude: 200K tokens, GPT-4: 128K tokens.

⚙️ Prompting

Konsten att formulera instruktioner för att få bästa resultat. "Prompt engineering" är en egen disciplin.

🔄 Fine-tuning

Vidarträna en modell på specifik data för att specialisera den för en uppgift.

Träningsprocessen för LLM:er

Fas	Beskrivning
1. Pre-training	Tränas på internet-skala text (böcker, webb, kod). Lär sig språk och kunskap.
2. Fine-tuning	Tränas på specifika instruktioner och svar för att bli hjälpsam.
3. RLHF	Reinforcement Learning from Human Feedback - människor betygsätter svar.
4. Safety training	Träning för att undvika skadligt innehåll och följa riktlinjer.

Styrkor och svagheter

✅ Styrkor

Extremt god på språk
Bred kunskap
Anpassningsbar
Kreativ

⚠️ Svagheter

Hallucinationer (hittar på)
Inget minne mellan sessioner
Kunskap har cutoff-datum
Kan vara översäkert felaktig

🎯 Din tur!

Fråga en AI hur den själv fungerar - svaret kan överraska dig:

Förklara hur du fungerar under huven. Vad händer steg för steg när jag skickar ett meddelande till dig?

🧪 Testa dig själv

Vad är en LLM:s grundläggande uppgift under träning?

Förstå meningen av text

Förutsäga nästa ord i en text

Översätta mellan språk

Klassificera text i kategorier