Blogi · käytännön kirjoituksia

Mitä olen oppinut AI-avusteisesta tuotannosta.

Lyhyitä, käytännönläheisiä kirjoituksia Claude Code:sta, eval harnesseista, RAG-arkkitehtuureista ja säännellystä toimialasta — sellaisia kuin olisin halunnut lukea itse aloittaessani.

Postaukset

2026-05-04

LLM-evaluointiharnessi: miksi AI-tuote tarvitsee sellaisen ja miten rakentaa

Mallin vaihto tai prompt-muutos rikkoo hiljaa toimintoja. Eval harness mittaa AI-vastausten laatua kuten yksikkötestit mittaavat koodia. Konkreettinen malli Devometric-projektista — golden datasetit, judge-mallit, CI-integraatio.

eval harness · LLM-as-judge · RAG · CI · Anthropic API

Tilaa uudet kirjoitukset

Postauksia n. 1× kuukaudessa. Ei roskaa, ei mainoksia — pelkkiä käytännön havaintoja AI-avusteisesta kehityksestä. Liity LinkedInissä tai seuraa GitHubissa.

LinkedIn GitHub Tilaa sähköpostilla