Tekoäly Sanasto
Tekoälyn maailmassa termit lentävät nopeasti. Kokosimme tälle sivulle yleisimmät tekoälyyn liittyvät käsitteet selkokielellä — jotta pysyt kärryillä, vaikka tekniikka kehittyy päivittäin.
Hyppää suoraan: Perusteet · Tekniikka · Käytännön työkalut
🧠 Perusteet
- Tekoäly (AI, Artificial Intelligence) — Tietokoneohjelma, joka suorittaa tehtäviä jotka normaalisti vaatisivat ihmisen älykkyyttä: tekstin ymmärtäminen, kuvien tunnistaminen, päätösten tekeminen.
- Koneoppiminen (ML, Machine Learning) — Tekoälyn osa-alue, jossa kone oppii datasta ilman tarkkaa ohjelmointia. Esimerkiksi roskapostisuodatin oppii tunnistamaan roskapostia esimerkkien perusteella.
- Syväoppiminen (Deep Learning) — Koneoppimisen menetelmä, joka käyttää monikerroksisia neuroverkkoja. Tehokas erityisesti kuvan- ja puheentunnistuksessa.
- Neuroverkko (Neural Network) — Ihmisaivojen toiminnasta inspiroitunut matemaattinen malli, jossa keinotekoiset ”neuronit” käsittelevät tietoa kerroksittain.
- Malli (Model) — Koulutettu tekoäly, joka osaa suorittaa tietyn tehtävän. Esimerkiksi GPT-5o on tekstin tuottamiseen koulutettu malli.
- Token — Tekstin pienin käsiteltävä yksikkö tekoälymalleille. Yksi token on noin ¾ englanninkielisestä sanasta. Suomen kielessä yksi token on usein yksi tavu tai lyhyt sana.
🔧 Tekniikka
- LLM (Large Language Model, suuri kielimalli) — Valtava neuroverkko, joka on koulutettu valtavilla tekstimassoilla. Osaa tuottaa, tiivistää, kääntää ja analysoida tekstiä. Esimerkkejä: GPT-5o, Claude, Gemini.
- Prompt — Tekstisyöte, jonka annat tekoälylle. Kysymys, käsky tai kuvaus siitä mitä haluat tekoälyn tekevän.
- Promptaus (Prompt Engineering) — Taito kirjoittaa tehokkaita syötteitä, joilla saat tekoälystä parhaan mahdollisen vastauksen.
- Konteksti-ikkuna (Context Window) — Kuinka paljon tekstiä malli voi ”muistaa” yhdessä keskustelussa. Mitä suurempi, sitä pidempiä dokumentteja voit käsitellä kerralla. Esimerkiksi 1M token = noin 750 000 sanaa.
- Hallusinaatio (Hallucination) — Kun tekoäly tuottaa itsevarmasti tietoa, joka on väärin tai keksittyä. Malli ei ”valehtele” — se ennustaa sanoja tilastollisesti ilman todellista ymmärrystä.
- Päättely (Reasoning) — Mallin kyky ajatella vaiheittain ennen vastaamista. Päättelymallit (kuten o1, DeepSeek-R1) käyttävät enemmän aikaa monimutkaisten ongelmien ratkomiseen.
- Fine-tuning (Hienosäätö) — Perusmallin jatkokouluttaminen erikoistuneella datalla, jotta se suoriutuu paremmin tietystä tehtäväalueesta.
- RAG (Retrieval-Augmented Generation) — Tekniikka jossa malli yhdistää oman tietonsa ulkopuolisesta lähteestä haettuun ajantasaiseen tietoon. Vähentää hallusinaatioita ja pitää vastaukset ajantasaisina.
- Embedding (Upotusvektori) — Tekstin muuntaminen numeromuotoon, jota kone voi vertailla matemaattisesti. Samankaltaiset tekstit saavat lähekkäiset vektoriesitykset. Käytetään semanttisessa haussa.
- Lämpötila (Temperature) — Säädin joka määrittää kuinka luova tai ennakoitava mallin vastaus on. Matala lämpötila (0–0.3) = tarkka, johdonmukainen; Korkea (0.7–1.0) = luova, yllättävä.
💼 Käytännön työkalut
- Chatbot / AI-assistentti — Keskustelupohjainen tekoäly, jolle voit puhua luonnollisella kielellä. Voi toimia chatissa, sähköpostissa tai koodieditorissa.
- Agentti (AI Agent) — Tekoäly joka ei vain vastaa kysymyksiin, vaan toimii: hakee tietoa, ajaa koodia, luo tiedostoja, lähettää viestejä. Itsenäinen toimija, jolla on työkalut käytössään. Esimerkki: Hermes Agent.
- Koodiavustaja (Code Assistant, Copilot) — Tekoäly joka auttaa ohjelmoinnissa: ehdottaa koodia, etsii bugeja, selittää funktioita. Esimerkkejä: GitHub Copilot, Cursor, Claude Code.
- Tekstistä-kuvaksi (Text-to-Image) — Malli joka luo kuvan tekstikuvauksen perusteella. Esimerkkejä: FLUX, Midjourney, DALL·E, Krea.
- Tekstistä-videoksi (Text-to-Video) — Malli joka luo videota tekstikuvauksen perusteella. Esimerkkejä: Sora, Runway, Kling.
- Tekoälypuhe (TTS, Text-to-Speech) — Muuntaa tekstin puhutuksi puheeksi. Nykyaikaiset mallit kuulostavat erittäin luonnollisilta. Esimerkkejä: ElevenLabs, Piper TTS.
- Puheesta-tekstiksi (STT, Speech-to-Text) — Muuntaa puhutun puheen kirjoitetuksi tekstiksi. Esimerkkejä: Whisper, Google Speech-to-Text.
- API (Application Programming Interface) — Rajapinta jonka kautta voit käyttää tekoälyä omissa ohjelmissasi. Maksat yleensä tokenien tai kutsujen mukaan.
- Open Source -malli — Tekoälymalli jonka painokertoimet (weights) ovat julkisesti saatavilla. Voit ladata ja ajaa sitä omalla koneellasi. Esimerkkejä: Llama, Mistral, DeepSeek, Qwen.
- Proprietary-malli — Kaupallinen malli, jota käytetään vain palveluntarjoajan API:n kautta. Et voi ladata sitä omalle koneellesi. Esimerkkejä: GPT-5o, Claude, Gemini Ultra.
- Multimodaali (Multimodal) — Malli joka osaa käsitellä useampaa datatyyppiä: tekstiä, kuvia, ääntä, videota. Esimerkiksi GPT-5o osaa katsoa kuvaa ja keskustella siitä.
📊 Mallien vertailutermejä
- Benchmark — Standardoitu testi jolla mitataan mallin suorituskykyä tietyissä tehtävissä. Esimerkiksi MMLU (yleistieto), HumanEval (koodaus), SWE-bench (ohjelmistokehitys).
- Parametri (Parameter) — Neuroverkon säädettävä painokerroin. Mitä enemmän parametreja, sitä ”isompi” ja yleensä kyvykkäämpi malli — mutta myös raskaampi ajaa.
- Open Weights — Mallin painokertoimet ovat ladattavissa, mutta koulutusdata tai -koodi ei välttämättä ole. Eri asia kuin täysin avoimen lähdekoodin malli.
- Inferenssi (Inference) — Vaihe jossa koulutettua mallia käytetään ennustamaan vastauksia uusille syötteille. ”Mallin ajaminen” käytännössä.
Sivua päivitetään säännöllisesti — viimeisin päivitys: toukokuu 2026.