Illustrasjonen over: Tolkning av bergartsbilder ved hjelp av sammensatt arbeidsflyt som inkluderer «unsupervised learning». Hovedbildet viser en borekaksprøve. Bildet øverst til høyre viser en ikke veiledet tolkning av borekaksprøven, som er grunnlaget for bildet nederst til høyre som viser en litologisk tolkning av den samme prøven. Denne typen tolkning av alle borekaksprøvene på norsk sokkel gjøre det mulig å lage logger som viser prosentvis fordeling av bergarter og mineraler langs alle brønnbanene. Data gjengitt med tillatelse fra Lundin Energy.
– Ved å ta i bruk datamaskinenes evne til å knuse nærmest uendelige mengder med data, åpnes helt nye muligheter til å skaffe innsikt i geologiske problemstillinger som geologene tidligere bare kunne drømme om, hevder Eirik Larsen, gründer og Chief Solutions Officer i Earth Science Analytics.
I to foregående artikler har Larsen forklart hva maskinlæring er og hvordan maskiner kan bidra til å forkorte tiden som går med til sammenstilling av data betydelig, samtidig som volumet av data som blir analysert kan øke.
Første artikkel: Mer effektivt – og bedre kvalitet
Andre artikkel: «Big data» kan finne de siste oljedråpene
Maskinlæring har to steg, det første er treningssteget, det andre er å gjøre prediksjoner om egenskaper, forklarer Larsen.
Kort fortalt kan maskiner læres til å sammenstille data og se sammenhenger på to måter; veiledet og ikke-veiledet.
Larsen presenterer et eksempel på veiledet læring med basis i arbeidsrutiner som Earth Science Analytics selv har god erfaring med.
Eirik Larsen er blant foredragsholderne under DIGEX 2022-konferansen som i år arrangeres i Stavanger, samt digitalt, 6. – 7. april.
– Petrofysikerne kan beregne porøsitet i en sandstein ut fra tetthetsdata. Ligningen trenger tre inputparametere [input] og gir oss porøsitetsverdier som kan brukes til å lage porøsitetslogger [output].
I utgangspunktet er dette en enkel regneoperasjon.
– Sandsteinens tetthet (ρb) er en funksjon av tettheten til mineralkornene (ρma), porøsiteten (ϕden) og tettheten til fluidene – væske/gass (ρf). For å kunne løse ligningen med hensyn på porøsitet (ϕden), må petrofysikeren imidlertid anta verdier for to ukjente størrelser (ρma og ρf).
ML-modeller som har lært fra data i form av input-output par, som brønnlogger og porøsitetslogger i eksempelet over, er det som kalles veiledet læring («supervised learning»), og som ifølge Larsen har stor kommersiell nytteverdi.
Men ikke alle data fra norsk sokkel er strukturert like enkelt (tabulære data) som i eksemplet over. De største datamengdene er ustrukturerte, eksempelvis seismikk, bilder og tekst.
Ulempen er at brukeren må ha tilgjengelig store mengder av både input- og outputdata for å lete frem en lovmessighet som kan brukes til prediksjoner på nye data.

For å unngå denne avhengigheten, er det nødvendig å ta i bruk ikke-veiledet læring («unsupervised learning»). Da blir fremgangsmåten en helt annen.
Utgangspunktet kan igjen være brønndata, for eksempel logger, der hver enkelt logg (for eksempel tetthet, resistivitet) har sine egne verdier gitt som funksjon av dyp.
– Jobben består da i å sortere verdiene fra de forskjellige loggene i et sett med klasser, der vi – for det første – ønsker å maksimere likheten mellom datapunkter innenfor samme klasse, og – for det andre – maksimere forskjellene mellom data som opptrer i forskjellige klasser. Dette kalles også «klyngeanalyse».
– Datapunkter som viser både lav tetthet, lav hastighet, lav gammaverdi, og høy resistivitet kan for eksempel ende opp i én klasse, mens datapunkter med høy tetthet, høy hastighet, lav gammaverdi, og høy resistivitet kan ende opp i en annen klasse.
Det vil så være opp til brukeren å tolke hva dette betyr rent geologisk. I tilfellet over kunne tolkningen være at den ene klyngen korresponderer med gassfylt, porøs sandstein, mens den andre klyngen representerer sementert sandstein.
– Det er lett å forstå at datamaskinene kan gjøre slike analyser på store mengder data uendelig mye raskere enn den menneskelige hjernen er i stand til, og på den måten også få mer ut av dataene på kort tid, påpeker Larsen.
Vi forstår det da slik at det er geologen – mennesket – som skal gi mening til alle de klassene som maskinen har lagt frem for oss.
Denne saken er en del av et lengre intervju med Eirik Larsen skrevet for GEO 2022.