Tekoäly Sanasto

Tekoälyn maailmassa termit lentävät nopeasti. Kokosimme tälle sivulle yleisimmät tekoälyyn liittyvät käsitteet selkokielellä — jotta pysyt kärryillä, vaikka tekniikka kehittyy päivittäin.

Hyppää suoraan: Perusteet · Tekniikka · Käytännön työkalut

🧠 Perusteet

Tekoäly (AI, Artificial Intelligence) — Tietokoneohjelma, joka suorittaa tehtäviä jotka normaalisti vaatisivat ihmisen älykkyyttä: tekstin ymmärtäminen, kuvien tunnistaminen, päätösten tekeminen.
Koneoppiminen (ML, Machine Learning) — Tekoälyn osa-alue, jossa kone oppii datasta ilman tarkkaa ohjelmointia. Esimerkiksi roskapostisuodatin oppii tunnistamaan roskapostia esimerkkien perusteella.
Syväoppiminen (Deep Learning) — Koneoppimisen menetelmä, joka käyttää monikerroksisia neuroverkkoja. Tehokas erityisesti kuvan- ja puheentunnistuksessa.
Neuroverkko (Neural Network) — Ihmisaivojen toiminnasta inspiroitunut matemaattinen malli, jossa keinotekoiset ”neuronit” käsittelevät tietoa kerroksittain.
Malli (Model) — Koulutettu tekoäly, joka osaa suorittaa tietyn tehtävän. Esimerkiksi GPT-5o on tekstin tuottamiseen koulutettu malli.
Token — Tekstin pienin käsiteltävä yksikkö tekoälymalleille. Yksi token on noin ¾ englanninkielisestä sanasta. Suomen kielessä yksi token on usein yksi tavu tai lyhyt sana.

🔧 Tekniikka

LLM (Large Language Model, suuri kielimalli) — Valtava neuroverkko, joka on koulutettu valtavilla tekstimassoilla. Osaa tuottaa, tiivistää, kääntää ja analysoida tekstiä. Esimerkkejä: GPT-5o, Claude, Gemini.
Prompt — Tekstisyöte, jonka annat tekoälylle. Kysymys, käsky tai kuvaus siitä mitä haluat tekoälyn tekevän.
Promptaus (Prompt Engineering) — Taito kirjoittaa tehokkaita syötteitä, joilla saat tekoälystä parhaan mahdollisen vastauksen.
Konteksti-ikkuna (Context Window) — Kuinka paljon tekstiä malli voi ”muistaa” yhdessä keskustelussa. Mitä suurempi, sitä pidempiä dokumentteja voit käsitellä kerralla. Esimerkiksi 1M token = noin 750 000 sanaa.
Hallusinaatio (Hallucination) — Kun tekoäly tuottaa itsevarmasti tietoa, joka on väärin tai keksittyä. Malli ei ”valehtele” — se ennustaa sanoja tilastollisesti ilman todellista ymmärrystä.
Päättely (Reasoning) — Mallin kyky ajatella vaiheittain ennen vastaamista. Päättelymallit (kuten o1, DeepSeek-R1) käyttävät enemmän aikaa monimutkaisten ongelmien ratkomiseen.
Fine-tuning (Hienosäätö) — Perusmallin jatkokouluttaminen erikoistuneella datalla, jotta se suoriutuu paremmin tietystä tehtäväalueesta.
RAG (Retrieval-Augmented Generation) — Tekniikka jossa malli yhdistää oman tietonsa ulkopuolisesta lähteestä haettuun ajantasaiseen tietoon. Vähentää hallusinaatioita ja pitää vastaukset ajantasaisina.
Embedding (Upotusvektori) — Tekstin muuntaminen numeromuotoon, jota kone voi vertailla matemaattisesti. Samankaltaiset tekstit saavat lähekkäiset vektoriesitykset. Käytetään semanttisessa haussa.
Lämpötila (Temperature) — Säädin joka määrittää kuinka luova tai ennakoitava mallin vastaus on. Matala lämpötila (0–0.3) = tarkka, johdonmukainen; Korkea (0.7–1.0) = luova, yllättävä.

💼 Käytännön työkalut

Chatbot / AI-assistentti — Keskustelupohjainen tekoäly, jolle voit puhua luonnollisella kielellä. Voi toimia chatissa, sähköpostissa tai koodieditorissa.
Agentti (AI Agent) — Tekoäly joka ei vain vastaa kysymyksiin, vaan toimii: hakee tietoa, ajaa koodia, luo tiedostoja, lähettää viestejä. Itsenäinen toimija, jolla on työkalut käytössään. Esimerkki: Hermes Agent.
Koodiavustaja (Code Assistant, Copilot) — Tekoäly joka auttaa ohjelmoinnissa: ehdottaa koodia, etsii bugeja, selittää funktioita. Esimerkkejä: GitHub Copilot, Cursor, Claude Code.
Tekstistä-kuvaksi (Text-to-Image) — Malli joka luo kuvan tekstikuvauksen perusteella. Esimerkkejä: FLUX, Midjourney, DALL·E, Krea.
Tekstistä-videoksi (Text-to-Video) — Malli joka luo videota tekstikuvauksen perusteella. Esimerkkejä: Sora, Runway, Kling.
Tekoälypuhe (TTS, Text-to-Speech) — Muuntaa tekstin puhutuksi puheeksi. Nykyaikaiset mallit kuulostavat erittäin luonnollisilta. Esimerkkejä: ElevenLabs, Piper TTS.
Puheesta-tekstiksi (STT, Speech-to-Text) — Muuntaa puhutun puheen kirjoitetuksi tekstiksi. Esimerkkejä: Whisper, Google Speech-to-Text.
API (Application Programming Interface) — Rajapinta jonka kautta voit käyttää tekoälyä omissa ohjelmissasi. Maksat yleensä tokenien tai kutsujen mukaan.
Open Source -malli — Tekoälymalli jonka painokertoimet (weights) ovat julkisesti saatavilla. Voit ladata ja ajaa sitä omalla koneellasi. Esimerkkejä: Llama, Mistral, DeepSeek, Qwen.
Proprietary-malli — Kaupallinen malli, jota käytetään vain palveluntarjoajan API:n kautta. Et voi ladata sitä omalle koneellesi. Esimerkkejä: GPT-5o, Claude, Gemini Ultra.
Multimodaali (Multimodal) — Malli joka osaa käsitellä useampaa datatyyppiä: tekstiä, kuvia, ääntä, videota. Esimerkiksi GPT-5o osaa katsoa kuvaa ja keskustella siitä.

📊 Mallien vertailutermejä

Benchmark — Standardoitu testi jolla mitataan mallin suorituskykyä tietyissä tehtävissä. Esimerkiksi MMLU (yleistieto), HumanEval (koodaus), SWE-bench (ohjelmistokehitys).
Parametri (Parameter) — Neuroverkon säädettävä painokerroin. Mitä enemmän parametreja, sitä ”isompi” ja yleensä kyvykkäämpi malli — mutta myös raskaampi ajaa.
Open Weights — Mallin painokertoimet ovat ladattavissa, mutta koulutusdata tai -koodi ei välttämättä ole. Eri asia kuin täysin avoimen lähdekoodin malli.
Inferenssi (Inference) — Vaihe jossa koulutettua mallia käytetään ennustamaan vastauksia uusille syötteille. ”Mallin ajaminen” käytännössä.

Sivua päivitetään säännöllisesti — viimeisin päivitys: toukokuu 2026.