RAG (retrieval-augmented generation) yhdistää tiedonhaun ja kielimallin: tekoäly hakee vastauksen ensin yrityksesi omista dokumenteista ja muotoilee sen vasta sitten. Tulos on tekoäly, joka tuntee sopimuksesi, raporttisi ja ohjeistuksesi – eikä keksi omiaan.
Tällä sivulla kerromme, miten RAG toimii, mikä sen laadussa oikeasti ratkaisee ja mitä 60 RAG-järjestelmän vertailu paljasti yksityisen ja pilvipohjaisen RAGin eroista suomenkielisille yritysdokumenteille. Voit tilata tekemämme tutkimusraportin luettavaksesi.
Valossa on kehittänyt suomalaisille yrityksille sopivan agenttisen RAG-ratkaisun, jota voit käyttää täysin yksityisesti. Pyydä lisätietoja Valossan RAG-ratkaisusta.


RAG eli haku-täydennetty generointi on tekoälyarkkitehtuuri, jossa kielimalli ei vastaa muistinsa varassa, vaan sille haetaan ensin oikeat lähdekohdat yrityksen omasta aineistosta. Kielimalli muotoilee vastauksen löydettyjen lähteiden pohjalta. Näin vastaukset perustuvat yrityksen todelliseen tietoon, pysyvät ajantasaisina ja ovat jäljitettävissä lähteisiin – ilman että mallia tarvitsee kouluttaa uudelleen.
Agentillinen RAG tarkoittaa, että tekoälyagentti käyttää kielimalleja ja hakutyökaluja toistuvasti kunnes oikeellinen tieto löytyy ja hyvä luonnollisen kielen vastaus voidaan tuottaa.
Yrityksen dokumentit (sopimukset, raportit, ohjeet, sähköpostiarkistot) analysoidaan: luetaan, pilkotaan ja viedään hakuindeksiin.
Kun käyttäjä kysyy, järjestelmä hakee indeksistä kysymykseen liittyvät kohdat – ei koko dokumenttia, vaan olennaiset katkelmat.
Kielimalli saa kysymyksen ja löydetyt lähteet, ja muotoilee vastauksen niiden pohjalta lähdeviitteineen.


Suomenkielisten yritysdokumenttien RAG-testeissä sama kielimalli tuotti selvästi parempia vastauksia kun sen alla oli erityisesti suomen kieleen kehitetty hakumoottorimme yksinkertaisen tietokantahaun sijaan. Jos haku ei löydä oikeita kohtia, paraskaan malli ei voi vastata oikein – se joko myöntää tietämättömyytensä tai arvaa. Siksi RAG-järjestelmissä tärkein valinta ei ole kielimalli vaan hyvä hakuteknologia ja työkalut. Me rakensimme sen.
Vertasimme yhdessä Jtel Oy:n kanssa 60 järjestelmäajossa erilaisia RAG-komponentteja suomenkielisissä yritystiedon hakutehtävissä. Tulokset yllättivät: itse ylläpidetyt, avoimiin malleihin perustuvat yhdistelmät ylsivät kaupallisen pilvikokoonpanon ohi.


88%
Hyödyllisten vastausten osuus
72%
Täysin oikeiden vastausten osuus
87%
Hyödyllisten vastausten osuus
70%
Täysin oikeiden vastausten osuus
86%
Hyödyllisten vastausten osuus
62%
Täysin oikeiden vastausten osuus
Hyödylliset vastaukset kuvaavat agentillisen RAG-järjestelmän kykyä tuottaa ainakin osa tarvittavista tiedoista. n. 20% testin yritystietojen hakutehtävistä oli tarkoituksellisesti erittäin haastavia tai epäselvästi määriteltyjä. Kaikkien järjestelmien toiminta mahdollistaa hyvin päivittäisen hyötykäytön tiedonhaun tehtävissä.


Suomi, ja muut erityiset kieliryhmät, ovat RAG-järjestelmille vaativia: taivutusmuodot ja yhdyssanat karsivat naiivin haun osumia.
Juuri siksi laadimme aidon yritystieto-benchmarkin suomenkielisillä tehtävillä, jotta hakukomponettien ja tekoälyn laatu korostuu vielä enemmän kuin englannin kielisissä RAG-testeissä.
Tulostemme perusteella hyvin rakennettu yksityinen RAG toimii suomeksi erinomaisesti.
Tyypillisiä kohteita ovat sisäinen tietämyshaku (sopimukset, hankkeet, päätökset, sähköpostit), asiakaspalvelun ja myynnin taustatuki, laatu- ja compliance-dokumentaatiotietojen haku sekä arkistokyselyihin vastaus luonnollisella kielellä. Valossalla RAG ulottuu myös videoon ja ääneen: sama periaate, jolla haetaan dokumenteista, toimii kokous- ja videoarkistoissa.
Saat koko tutkimuksen: 60 järjestelmäajon tulokset, testatut kokoonpanot ja suositukset siitä, milloin yksityinen RAG-pino kannattaa. Toimitamme raportin sähköpostiisi henkilökohtaisesti. Raportti on englanninkielinen.
Käytämme yhteystietojasi vain tutkimuksen toimittamiseen ja siihen liittyvään yhteydenpitoon. Emme lisää sinua postituslistalle ilman lupaasi.
RAG (retrieval-augmented generation) on tekoälyarkkitehtuuri, jossa kielimallille haetaan ensin oikeat lähdekohdat yrityksen omasta aineistosta ja vastaus muotoillaan niiden pohjalta. Näin tekoäly vastaa yrityksen todellisesta tiedosta eikä muistinsa varassa.
Yleinen chat-palvelu vastaa koulutusdatansa pohjalta eikä tunne yrityksesi aineistoa. RAG-järjestelmä hakee vastauksen omista dokumenteistasi ja viittaa lähteisiin. Lisäksi yksityisessä RAG-pinossa aineisto ei koskaan poistu omasta ympäristöstäsi.
Kyllä. Hienosäätö muuttaa itse mallia ja vaatii uudelleenkoulutuksen aina kun tieto muuttuu. RAGissa tieto elää hakuindeksissä: kun dokumentti päivittyy, vastauksetkin päivittyvät – ilman koulutusta.
Yksityisessä RAG-pinossa kyllä: mallit ja hakuindeksi ajetaan omassa konesalissa tai valitussa EU-ympäristössä, eikä aineistoa lähetetä kolmansien osapuolten palveluihin tai käytetä mallien kouluttamiseen.
Vähemmän kuin usein luullaan: benchmarkimme resurssioptimoitu pino ylsi 87 prosentin hyödyllisten vastausten osuuteen kahdella GPU:lla. Aloittaa voi rajatulla aineistolla ja 90 päivän pilotilla, ei vuosien hankkeella.
Valossan ja Jtel Oy:n vuonna 2026 toteuttamasta vertailusta: 60 järjestelmäajoa suomenkielisillä yritystiedon hakutehtävillä, samat tehtävät ja arviointikriteerit kaikille kokoonpanoille. Koko raportin saa ladattua tältä sivulta.
Valossa on kehittänyt dokumenttien analyysipalvelun, jonka voi isännöidä yksityisellä palvelimella. Se käsittelee videot, audion ja monenmuotoisia dokumentteja, tunnistaa niistä kielelliset sisällöt ja jäsentää ne indeksoituvaksi Valossa Search palvelulle.
Valossa on yhdistänyt kehittyneen dokumentti- ja media-analyysin tehokkaaseen hakuun, joka on suunniteltu erityisesti agenttiseen tiedonhakuun RAG-mallilla. Valossan kokonaisratkaisu yhdistää analyysin, haun, ja agenttisen valjaan (harness) sekä optimoidut, avoimet kielimallit. Lopputuloksena on tehokas, yksityinen, ja isoihin toimittajiin verrattuna suorituskykyinen järjestelmä, jolla yritykset voivat löytää vastaukset tietopyyntöihinsä dokumenttien sisällöistä.
Haluatko nähdä RAGin toiminnan omalla aineistollasi?
Tarjoamme pilotin, jossa näet Valossa Search ja agenttisen RAG-järjestelmän toiminnan käytännössä.