RAG – tekoäly, joka vastaa yrityksesi omasta datasta

RAG (retrieval-augmented generation) yhdistää tiedonhaun ja kielimallin: tekoäly hakee vastauksen yrityksesi omista dokumenteista ja muotoilee sen luonnollisella kielellä. Tekoäly siis tuntee sopimuksesi, raporttisi ja ohjeistuksesi – eikä keksi omiaan.

Tällä sivulla kerromme mistä agenttinen RAG rakentuu, mikä tekee siitä laadukkaan ja mitä 60 RAG-järjestelmän vertailu paljasti yksityisen ja pilvipohjaisen RAGin eroista suomenkielisissä yritystiedonhauissa. Voit tilata tekemämme tutkimusraportin luettavaksesi. 

Valossa on kehittänyt suomalaisille yrityksille sopivan agenttisen RAG-ratkaisun, jota voit käyttää täysin yksityisesti. Pyydä lisätietoja Valossan RAG-ratkaisusta.

Mikä on RAG? Entä agentillinen RAG?

RAG eli haku-täydennetty generointi on tekoälyarkkitehtuuri, jossa kielimalli ei vastaa muistinsa varassa, vaan sille haetaan ensin oikeat lähdekohdat yrityksen omasta aineistosta. Kielimalli muotoilee vastauksen löydettyjen lähteiden pohjalta. Näin vastaukset perustuvat yrityksen todelliseen tietoon, pysyvät ajantasaisina ja ovat jäljitettävissä lähteisiin – ilman että mallia tarvitsee kouluttaa uudelleen. 

Agentillinen RAG tarkoittaa, että tekoälyagentti käyttää kielimalleja ja hakutyökaluja toistuvasti kunnes oikeellinen tieto löytyy ja hyvä luonnollisen kielen vastaus voidaan tuottaa.

Miten RAG toimii — kolme vaihetta

Indeksointi

Yrityksen dokumentit (sopimukset, raportit, ohjeet, sähköpostiarkistot) analysoidaan: luetaan, pilkotaan ja viedään hakuindeksiin.

Haku

Kun käyttäjä kysyy, järjestelmä hakee indeksistä kysymykseen liittyvät kohdat – ei koko dokumenttia, vaan olennaiset katkelmat.

Generointi

Kielimalli saa kysymyksen ja löydetyt lähteet, ja muotoilee vastauksen niiden pohjalta lähdeviitteineen.

Yllättävä totuus: hakuindeksi ratkaisee laadun, ei kielimallin koko

Testasimme kehittyneet LLM-malliperheet (mm. GLM, DeepSeek, Opus), sekä erilaisia agentti-valjaita kehittämällämme suomenkielisen yritystiedonhaun RAG-testillä. 

Sama kielimalli tuotti selvästi parempia vastauksia erityisesti suomen kieleen kehitetyllä hakukoneella yksinkertaisen tietokantahaun sijaan. 

Jos haku ei löydä oikeita kohtia, paraskaan malli ei voi vastata oikein – se joko myöntää tietämättömyytensä tai arvaa. Siksi RAG-järjestelmissä tärkein valinta ei ole kielimalli vaan hyvä hakuteknologia ja työkalut. Me rakensimme sen.

Yksityinen RAG vs. pilvipalvelut. Mitä 60 RAG-järjestelmän vertailu kertoo suomalaisesta agenttitekoälystä?

Vertasimme yhdessä Jtel Oy:n kanssa 60 järjestelmäajossa erilaisia RAG-komponentteja suomenkielisissä yritystiedon hakutehtävissä. Tulokset yllättivät: itse ylläpidetyt, avoimiin malleihin perustuvat yhdistelmät ylsivät kaupallisen pilvikokoonpanon ohi.

Keskeinen tulos — yksityinen RAG voittaa kaupallisen

Yksityinen
RAG

88%
Hyödyllisten vastausten osuus

72%
Täysin oikeiden vastausten osuus

Yksityinen RAG (optimoitu)

87%
Hyödyllisten vastausten osuus

70%
Täysin oikeiden vastausten osuus 

Kaupallinen
pilvi-RAG

86%
Hyödyllisten vastausten osuus

62%
Täysin oikeiden vastausten osuus

Hyödylliset vastaukset kuvaavat agentillisen RAG-järjestelmän kykyä tuottaa ainakin osa tarvittavista tiedoista. n. 20% testin yritystietojen hakutehtävistä oli tarkoituksellisesti erittäin haastavia tai epäselvästi määriteltyjä. Kaikkien järjestelmien toiminta mahdollistaa hyvin päivittäisen hyötykäytön tiedonhaun tehtävissä. 

Toimiiko agentillinen RAG suomeksi?

Suomi, ja muut erityiset kieliryhmät, ovat RAG-järjestelmille vaativia: taivutusmuodot ja yhdyssanat karsivat naiivin haun osumia. 

Juuri siksi laadimme aidon yritystieto-benchmarkin suomenkielisillä tehtävillä, jotta hakukomponettien ja tekoälyn laatu korostuu vielä enemmän kuin englannin kielisissä RAG-testeissä. 

Tulostemme perusteella hyvin rakennettu yksityinen RAG toimii suomeksi erinomaisesti.

Mihin yritykset käyttävät RAG-järjestelmiä?

Tyypillisiä kohteita ovat sisäinen tietämyshaku (sopimukset, hankkeet, päätökset, sähköpostit), asiakaspalvelun ja myynnin taustatuki, laatu- ja compliance-dokumentaatiotietojen haku sekä arkistokyselyihin vastaus luonnollisella kielellä. Valossalla RAG ulottuu myös videoon ja ääneen: sama periaate, jolla haetaan dokumenteista, toimii kokous- ja videoarkistoissa.

flexible exporting

Tilaa benchmark-raportti (20 sivua)

Saat koko tutkimuksen: 60 järjestelmäajon tulokset, testatut kokoonpanot ja suositukset siitä, milloin yksityinen RAG-pino kannattaa. Toimitamme raportin sähköpostiisi henkilökohtaisesti. Raportti on englanninkielinen.

Käytämme yhteystietojasi vain tutkimuksen toimittamiseen ja siihen liittyvään yhteydenpitoon. Emme lisää sinua postituslistalle ilman lupaasi.

RAG (retrieval-augmented generation) on tekoälyarkkitehtuuri, jossa kielimallille haetaan ensin oikeat lähdekohdat yrityksen omasta aineistosta ja vastaus muotoillaan niiden pohjalta. Näin tekoäly vastaa yrityksen todellisesta tiedosta eikä muistinsa varassa.

Yleinen chat-palvelu vastaa koulutusdatansa pohjalta eikä tunne yrityksesi aineistoa. RAG-järjestelmä hakee vastauksen omista dokumenteistasi ja viittaa lähteisiin. Lisäksi yksityisessä RAG-pinossa aineisto ei koskaan poistu omasta ympäristöstäsi.

Kyllä. Hienosäätö muuttaa itse mallia ja vaatii uudelleenkoulutuksen aina kun tieto muuttuu. RAGissa tieto elää hakuindeksissä: kun dokumentti päivittyy, vastauksetkin päivittyvät – ilman koulutusta.

Yksityisessä RAG-pinossa kyllä: mallit ja hakuindeksi ajetaan omassa konesalissa tai valitussa EU-ympäristössä, eikä aineistoa lähetetä kolmansien osapuolten palveluihin tai käytetä mallien kouluttamiseen.

Vähemmän kuin usein luullaan: benchmarkimme resurssioptimoitu pino ylsi 87 prosentin hyödyllisten vastausten osuuteen kahdella GPU:lla. Aloittaa voi rajatulla aineistolla ja 90 päivän pilotilla, ei vuosien hankkeella.

Valossan ja Jtel Oy:n vuonna 2026 toteuttamasta vertailusta: 60 järjestelmäajoa suomenkielisillä yritystiedon hakutehtävillä, samat tehtävät ja arviointikriteerit kaikille kokoonpanoille. Koko raportin saa ladattua tältä sivulta.

Valossa on kehittänyt dokumenttien analyysipalvelun, jonka voi isännöidä yksityisellä palvelimella. Se käsittelee videot, audion ja monenmuotoisia dokumentteja, tunnistaa niistä kielelliset sisällöt ja jäsentää ne indeksoituvaksi Valossa Search palvelulle.

Valossa on yhdistänyt kehittyneen dokumentti- ja media-analyysin tehokkaaseen hakuun, joka on suunniteltu erityisesti agenttiseen tiedonhakuun RAG-mallilla. Valossan kokonaisratkaisu yhdistää analyysin, haun, ja agenttisen valjaan (harness) sekä optimoidut, avoimet kielimallit. Lopputuloksena on tehokas, yksityinen, ja isoihin toimittajiin verrattuna suorituskykyinen järjestelmä, jolla yritykset voivat löytää vastaukset tietopyyntöihinsä dokumenttien sisällöistä. 

Valossan RAG-ratkaisut tarjoavat tehokkaan ja yksityisen tavan hallita yrityksen tietoa ja dokumentteja

Haluatko nähdä RAGin toiminnan omalla aineistollasi?
Tarjoamme pilotin, jossa näet Valossa Search ja agenttisen RAG-järjestelmän toiminnan käytännössä.