Guider • Oppskrifter • Eksempler

Guider for Ollama, LLM, RAG og KI‑agenter

En oppdatert samling guider for april 2026: fra modellvalg og ytelse til API-integrasjon, RAG og robuste agent‑workflows med sikkerhet i praksis.

Installasjon og grunnoppsett

Installer Ollama

Last ned fra offisiell side og verifiser at lokal server svarer før du bygger videre.

ollama run llama3.2

Oppdater og rydd

Hold oversikt over hva du har lastet ned og frigjør plass.

ollama list
ollama rm <modell>

Ytelse

Start med en mindre modell, mål svartid, og oppgrader modell eller maskinvare når flaskehalsen er dokumentert.

Modeller: valg, versjoner og “model files”

Velg modell etter bruksområde og tilgjengelig maskinvare. Her er et praktisk overblikk over aktuelle modeller (mars 2026):

Modell Størrelse Egner seg for
llama3.2 3B Rask chat, CPU-vennlig
mistral 7B Generell assistent, god balanse
gemma3:4b 4B Effektiv, Google-modell
phi4 14B Høy kvalitet, lite VRAM
qwen2.5-coder:7b 7B Kode og tekniske oppgaver
deepseek-r1:8b 8B Resonering, steg-for-steg
nomic-embed-text Embeddings til RAG
# Eksempel: lag en konfigurert modell med fast systemprompt
# (bruk Modelfile og bygg etter Ollama-dokumentasjonen)
Tips
  • Bruk tydelige svarformat: punkter, JSON, tabeller.
  • Sett “kildekrav” for RAG: “Svar kun basert på konteksten”.
  • Evaluer med egne testspørsmål – ikke bare “føles bra”.

Integrasjon: fra script til applikasjon

Du kan integrere med alt som kan gjøre HTTP-kall.

curl http://localhost:11434/api/generate -d '{
  "model": "llama3.2",
  "prompt": "Skriv en funksjon som validerer e-postadresser i JavaScript."
}'
Produksjon
  • Cache svar på dyre spørsmål.
  • Rate-limit per bruker og per endepunkt.
  • Logg, men maskér sensitive data.

RAG: “chat med dokumenter” som faktisk fungerer

Chunking

Del dokumenter i passende biter (ikke for store, ikke for små) og behold metadata.

Embeddings

Gjør tekst til vektorer, og bruk en indeks for rask relevans-søk.

Grounding

Legg inn kontekst + kildeliste i prompt. Be om svar med referanser.

KI‑agenter: arkitektur og sikkerhet

Agent‑mønsteret kombinerer en LLM med et sett verktøy og en planleggingssløyfe. For å lykkes må du begrense hva agenten kan gjøre, og bygge inn verifikasjon.

  • Definér verktøy (funksjoner) med eksplisitt input‑schema.
  • Whitelist domener/endepunkter for nettverkskall.
  • Bruk “human approval” for kritiske handlinger.
  • Evaluer med scenario‑tester og overvåk i drift.
Agent‑eksempel

Oppgave: “Les en loggfil, finn feil, lag en kort rapport og foreslå tiltak.”

Verktøy: fil-lesing (kun lese), regex‑søk, oppsummering, eksport til Markdown.