Välttämättömät evästeet

Tämä sivusto käyttää toimintansa kannalta välttämättömiä evästeitä tarjotakseen käyttäjälle sisältöä ja tiettyjä toiminnallisuuksia (esim. kielivalinta). Et voi vaikuttaa näiden evästeiden käyttöön.

Verkkosivuston kävijätilastot

Keräämme sivuston käytöstä kävijätilastoja. Tiedot eivät ole henkilöitävissä ja ne tallennetaan ainoastaan CSC:n hallinnoimaan Matomo-kävijäanalytiikkatyökaluun. Hyväksymällä kävijätilastoinnin sallit Matomon hyödyntää erilaisia teknologioita, kuten analytiikkaevästeitä ja verkkokutsuja, kun se kerää tilastoja sivun käytöstä.

Muuta tekemiäsi evästevalintoja ja lue lisätietoa kävijätilastoinnista ja evästeitä 

CSC

Tieteen tietotekniikan keskus CSC:llä järjestettiin lokakuussa Open Search Symposium Ossym25-tapahtuma, jossa esitellyt tutkimukset ja demot osoittavat, että tekoäly ei ainoastaan tue hakukoneiden teknistä kehitystä, vaan muuttaa perustavanlaatuisesti tapaa, jolla tietoa etsitään, tulkitaan ja hyödynnetään.

Ossym25 jatkoi Open Search Foundationin ja sen kumppanien vuosittaista konferenssisarjaa, jonka tavoitteena on edistää eurooppalaista riippumatonta hakuteknologiaa. Monet Ossymin esityksistä liittyivät OpenWebSearch.eu-projektiin, jossa on kehitetty avointa eurooppalaista verkkohakuindeksiä Open Web Indexiä (OWI) ja sitä tukevaa infrastruktuuria.

Tekoälyn integrointi verkkohakuihin

Yksi keskeisimmistä Ossymissa tunnistetuista teknisistä kehityssuunnista on generatiivisen tekoälyn integrointi verkkohakuihin. Suuret kielimallit (LLM) voivat tuottaa tiivistelmiä, vastauksia ja kontekstualisoituja tuloksia suoraan OWI-datasta. Tämä ei ainoastaan paranna hakutulosten relevanssia, vaan tekee tiedonhausta käyttäjälle ymmärrettävämpää ja tehokkaampaa.

Tätä lähestymistapaa tukee Retrieval-Augmented Generation (RAG), jossa LLM-mallit hakevat ensin relevanttia tietoa indeksistä ja käyttävät sitä generoidun sisällön tukena. Näin tekoäly ei toimi pelkkänä tekstintuottajana, vaan yhdistää hakuteknologian ja generatiivisen kyvykkyyden älykkääksi kokonaisuudeksi.

Eurooppalainen verkkoindeksidata (OWI) on saatavilla tekoälykehitykseen LUMI-tekoälytehtaan (LUMI AI Factory) Dataset-as-a-Service-palvelun kautta. Yksi LUMI-tekoälytehtaan keskeisistä tavoitteista on laadukkaiden ja arvokkaiden aineistojen tuonti tekoälykehityksen ja suurteholaskennan piiriin.

LUMI-tekoälytehdas on Euroopan unionin suurin tekoälytehdas, joka toimii yritysten, tutkimusryhmien ja julkisten toimijoiden yhteisenä TKI-toiminnan alustana ja kiihdyttäjänä. Se yhdistää kaiken tekoälykehitykseen tarvittavan yhteen paikkaan: maailmanluokan laskentatehon, korkealaatuisen datan ja huippuluokan osaamiskeskuksen. Tekoälytehtaan palvelut ovat maksuttomia startupeille, pk-yrityksille ja akateemisille tutkijoille.

Kohti parempia hakutuloksia

Tekoälyllä on myös merkittävä rooli semanttisen tiedon rikastamisessa. Verkkosisällöstä voidaan automaattisesti tunnistaa entiteettejä ja niiden välisiä suhteita, jolloin syntyy tietämysgraafeja. Näiden avulla hakukoneet voivat ymmärtää sisällön merkityksiä syvällisemmin ja tarjota käyttäjälle semanttisesti relevantteja tuloksia.

Paikkatiedon ja aiheiden automaattinen tunnistus on toinen konkreettinen sovellusalue. Tekoäly kykenee tunnistamaan verkkosisällöistä konteksteja, kuten sijainteja ja teemoja, mikä mahdollistaa paikallisesti kohdennetut ja aihepiiriltään tarkennetut hakutulokset.

Innovaatioiden tukemisessa tekoäly osoittaa voimansa myös eri tietolähteiden tietojen yhdistämisessä. Ossym25:ssa esiteltiin menetelmiä, joilla LLM-malleja käytetään laajentamaan ja yhdistämään esimerkiksi patenttirekisterien ja tieteellisten tutkimustulosten teknistä tietoa, mikä tukee uusien yhteyksien löytämistä. Keynote-puhuja Harri Ketamo (Headai) havainnollisti tietojen yhdistämisen potentiaalia demonstroimalla, miten omasta CV:stä ja avoimesti saatavilla olevasta datasta voi koostaa profiilin, jota voi verrata työpaikkailmoitusten vaatimuksiin, ja sitten etsiä täsmäkursseja ja koulutuksia osaamisensa kehittämiseksi saatavilla oleviin työpaikkoihin sopivaksi.

Sääntelyn keventäminen ja eettiset näkökulmat esillä

Tekoälyn käyttö verkkohakukontekstissa ei ole vain tekninen kysymys, vaan siihen liittyy myös taloudellisia, poliittisia, yhteiskunnallisia ja yksilön perusoikeuksia, kuten yksityisyyttä, koskevia ulottuvuuksia.

Euroopan komission varapuheenjohtaja Henna Virkkunen lähetti tapahtuman osallistujille videotervehdyksen, jossa hän korosti avoimen haun merkitystä demokratialle. Euroopan parlamentin jäsen Aura Salla puolestaan haastoi keynote-puheenvuorossaan komission AI-politiikan painopisteitä. Hän korosti tarvetta kehittää edellytyksiä markkinapohjaisille ratkaisuille ja panostaa sääntelyn keventämiseen eurooppalaisten yritysten globaalin kilpailukyvyn vahvistamiseksi.

Viivi Lähteenoja (MyData Company) toi esiin epistemisen hyveellisyyden merkityksen. Hyve-etiikka tarjoaa työkaluja tiedon luotettavuuden arvioimiseen ja esimerkiksi ennakkoluulojen ja valetiedon tunnistamiseen. Tämä eettinen näkökulma on keskeinen, kun rakennetaan tulevaisuuden hakuekosysteemejä, jotka palvelevat yhteiskuntaa kokonaisvaltaisesti.

Vuoden 2026 Ossym järjestetään Berliinissä lokakuussa 2026.

Kirjoittaja: Heidi Laine, LUMI AI Factoryn ”Data access and integration” -työpaketin vetäjä CSC:llä.

Kuva: Mikael Kanerva, CSC

Lue lisää