50 jaar Bioinformatica: Biologie van de toekomst?

Bioinformatica is nu een volwassen en bloeiend onderzoeksveld, onmisbaar bij het aanpakken van de uitdagingen van het levenswetenschappelijk onderzoek. In 50 jaar tijd is het vakgebied van de bioinformatica steeds relevanter geworden. Zal bioinformatica verdwijnen en een integraal onderdeel worden van de biowetenschappen? Of is bioinformatica de biologie van de toekomst?

Bioinformatica: de oorsprong van een term en een concept

Veel wiskundig biologen hielden zich vooral bezig met vogels en ecosystemen. Twee bioinformatici avant-la-lettre, Paulien Hogeweg en Ben Hesper, waren ook geïnteresseerd in moleculen en gebruikte baanbrekende simulaties die ze konden gebruiken als hulpmiddel om de toename van informatie in biologische systemen te begrijpen. Zoals Paulien Hogeweg schrijft in The Roots of bioinformatics in Theoretical Biology (PLOS Computational Biology): 'Wij vonden dat informatieverwerking op zijn minst een nuttige metafoor kon zijn voor het begrijpen van levende systemen. We vonden het daarom nuttig om naast biofysica en biochemie ook bioinformatica te onderscheiden als onderzoeksgebied (wat we een werkconcept noemden).’

Met de intrede van het sequencen, waardoor we de complete genetische code van organismen kunnen bepalen, heeft het onderzoeksveld dat deze gegevens bestudeert de naam bioinformatica overgenomen. Met de toename van de hoeveelheid data in de moderne levenswetenschappen wordt het oorspronkelijke idee van informatieverwerking steeds relevanter. De huidige bioinformatici in Utrecht werken samen in het Utrecht Bioinformatics Centre (UBC). Twee van haar leden delen hier hun ervaringen op het gebied van bioinformatica.

Berend Snel

Baanbrekend vakgebied

Berend Snel, hoogleraar bioinformatica, vertelt over zijn bevindingen in het vakgebied: "Ik werd geïnspireerd door een TV programma over Artifical Life op een zondagavond in de jaren '90. Ik ontdekte een nieuwe manier van nadenken over levende wezens!

Mijn keuze om biologie te gaan studeren in Utrecht werd sterk beïnvloed door het werk en de visie van Paulien Hogeweg. In mijn studietijd werd de analyse van grote hoeveelheden DNA belangrijk, wat het vakgebied bioinformatica nog interessanter maakte. Het was magisch om in de jaren negentig mijn stage te doen. De goudmijn aan gegevens was in Europa als eerste beschikbaar bij het European Molecular Biology Laboratory (EMBL) waar de computationeel biologen allemaal pionierden: o.a. Jaap Heringa (Elixir), Martijn Huynen (Radboud Universiteit) en ook UU eredoctor Peer Bork (EMBL). De vrijheid om daar met data te spelen en nieuwe kennis op te doen was geweldig! Nieuwe patronen, nieuwe vragen, nog meer nieuwe data, nieuwe manieren om naar dezelfde data te kijken... De huidige term 'data recycling' was nog onbekend, maar daar en toen werd bioinformatica een essentieel onderdeel van de Life Sciences."

Adrien Melquiond

Eerste databases voor artsen

Voor Adrien Melquiond, senior onderzoeker Computational Structural Bioinformatics, was geneeskunde veel te veel een theoretische opleiding.

"Ik ergerde me aan het bestuderen van alle tekstboeken en wilde op een meer data-gedreven manier leren. Naast mijn studie heb ik een langdurige stage van drie jaar gelopen in een onderzoeksgroep voor biomedische beeldverwerking. In het weekend ging ik naar ziekenhuizen om de eerste dataverzameling van ~5000 foetale afwijkingen op te bouwen, en ontwikkelde ik een beslissingsondersteunend systeem voor ultrasonografie. Hier hield ik echt van! In het begin van deze eeuw werkte ik aan de ontwikkeling van machine learning software om artsen te helpen bij vermoedens van foetale misvorming. Ik bleef daarna ook werken met data en aan software ontwikkeling waardoor ik in structurele bioinformatica belandde.”

Waardoor is bioinformatica groot geworden?

Wat is volgens jou de grootste doorbraak op het gebied van bioinformatica? Berend Snel antwoordt: "Het grote keerpunt was de mogelijkheid om te sequencen. Het wel of niet hebben van een genoom is de sleutel tot revolutionaire ontwikkelingen zoals het mogelijk maken van gepersonaliseerde geneeskunde. Met gerichte veredeling van zaden kunnen we bijvoorbeeld binnen enkele generaties een nieuw plantenras ontwikkelen. Daarnaast is de ontwikkeling op technologisch niveau erg belangrijk. Alle andere, meer recente levenswetenschappelijke data-explosies zoals genotypering, transcriptomics of proteomics zijn alleen mogelijk vanwege de beschikbaarheid van genomen. Deze nieuwe technieken helpen ons om te ontrafelen wat we niet kunnen zien in het cellulaire systeem. Zo kunnen we nieuwe gegevens verzamelen en aan nog meer innovatieve technieken werken. Het basisprincipe blijft hetzelfde, maar de gegevens zijn nauw verbonden met technieken die elkaar snel opvolgen en zullen worden vervangen door nieuwe. Soms voel ik me al oud."

FAIR data-principes

Adrien Melquiond voegt toe: "De laatste tijd spelen ontwikkelingen op het gebied van machine learning en deep learning een belangrijke rol in ons vakgebied. Zoals Berend terecht benadrukte, is dit alleen mogelijk door de sequencing revolutie en de rijkdom aan gegevens die daardoor ontstond. De eerste bioinformatica doorbraak kwam voort uit de visie van Margaret Dayhoff in de jaren vijftig, toen we data nog niet online konden delen. Bij 'Data first' ging het om het openen en delen van data, universele opslag, goede documentatie, duidelijke definities, et cetera. Je moet beschikken over ruimte om gegevens centraal te opslaan. Functies of fenotypes zijn moeilijk in een database te bewaren omdat ze te complex zijn, te voorwaardelijk. Omdat het ‘gelijkwaardig' delen van gegevens essentieel is, zijn de FAIR data-principes bedacht door baanbrekende bioinformatici zoals Margaret Dayhoff.”

Bioinformatica in de toekomst

In de metagenomica spreken bioinformatici over 70% donkere materie. Dat is het meest intrigerende van het gebied van de bioinformatica: er is zoveel dat we nog niet weten. Hoe meer technieken er zijn, hoe meer gegevens er beschikbaar komen. "Het is onbekend waar dit eindigt en dat wijst erop dat we de manier waarop we werken moeten veranderen. De toepassingsmogelijkheden zijn enorm groot en hoe meer mensen creatieve oplossingen vinden, hoe meer nieuwe resultaten er beschikbaar zullen komen. Waar gaat dit naar toe? Zal bioinformatica verdwijnen en een geïntegreerd onderdeel worden van de biologie of is bioinformatica de biologie van de toekomst?"

Citatie:
Hogeweg P (2011) The Roots of Bioinformatics in Theoretical Biology. PLoS Comput Biol 7(3): e1002021.