Hoe Computers Biologen helpen de Geheimen van het Leven te kraken

Nadat het menselijk genoom van drie miljard letterliter werd gesequenced, zijn we snel een nieuwe "omica"Tijdperk van biologisch onderzoek. Wetenschappers zijn nu aan het racen om de genomen (alle genen) of proteomen (alle eiwitten) van verschillende organismen te sequensen - en verzamelen in het proces enorme hoeveelheden gegevens.

Een wetenschapper kan bijvoorbeeld 'omics'-tools gebruiken, zoals DNA-sequencing om te ontrafelen welke menselijke genen worden beïnvloed door een virale griepinfectie. Maar omdat het menselijk genoom in totaal in totaal 25,000-genen heeft, kan het aantal gewijzigde genen zelfs onder een dergelijk eenvoudig scenario mogelijk in de duizenden liggen.

Hoewel sequentiebepaling en identificatie van genen en eiwitten ze een naam en een plaats geeft, vertelt het ons niet wat ze doen. We moeten begrijpen hoe deze genen, eiwitten en alle spullen ertussen wisselwerking in verschillende biologische processen.

Tegenwoordig leveren zelfs basisexperimenten big data op, en een van de grootste uitdagingen is het ontwarren van de relevante resultaten van achtergrondruis. Computers helpen ons deze gegevensberg te overwinnen; maar ze kunnen zelfs een stap verder gaan, ons helpen wetenschappelijke hypotheses te bedenken en nieuwe biologische processen te verklaren. Data science maakt in essentie hypermodern biologisch onderzoek mogelijk.

Computers naar de redding

Computers zijn uniek gekwalificeerd voor het verwerken van enorme gegevenssets, omdat ze tegelijkertijd alle belangrijke voorwaarden voor de analyse kunnen bijhouden.


innerlijk abonneren grafisch


Hoewel ze kan menselijke fouten weerspiegelen ze zijn geprogrammeerd met, computers kunnen efficiënt omgaan met grote hoeveelheden gegevens en ze zijn niet bevooroordeeld naar het bekende, zoals menselijke onderzoekers dat wel kunnen.

Computers kunnen ook worden geleerd om te zoeken naar specifieke patronen in experimentele gegevenssets - een concept dat machine learning wordt genoemd, eerst voorgesteld in de 1950s, met name door wiskundigen Alan Turing. Een algoritme dat de patronen uit datasets heeft geleerd, kan vervolgens worden gevraagd voorspellingen te doen op basis van nieuwe gegevens die nog nooit eerder zijn aangetroffen.

Machinaal leren heeft een revolutie teweeggebracht in biologisch onderzoek, aangezien we nu grote datasets kunnen gebruiken en computers kunnen vragen de onderliggende biologie te helpen begrijpen.

Computers trainen om na te denken door hersenprocessen te simuleren

We hebben in ons eigen lab een interessant soort machine learning, een zogenaamd artificial neural network (ANN), gebruikt. Hersenen zijn sterk met elkaar verbonden netwerken van neuronen, die communiceren door elektrische pulsen door de neurale bedrading te sturen. Evenzo simuleert een ANN in de computer een netwerk van neuronen als ze aan en uit gaan als reactie op de signalen van andere neuronen.

Door algoritmen toe te passen die de processen van echte neuronen nabootsen, kunnen we het netwerk leren om vele soorten problemen op te lossen. Google gebruikt een krachtige ANN voor zijn nu beroemde Deep Dream-project waar computers classificatie kunnen classificeren en zelfs kunnen maken.

Onze groep bestudeert het immuunsysteem, met als doel nieuwe therapieën voor kanker uitzoeken. We hebben ANN-computermodellen gebruikt om korte oppervlakte-eiwitcodes te bestuderen die onze immuuncellen gebruiken om te bepalen of iets vreemd is voor ons lichaam en daarom moet worden aangevallen. Als we meer begrijpen over hoe onze immuuncellen (zoals T-cellen) differentiëren tussen normale / eigen en abnormale / vreemde cellen, kunnen we betere vaccins en therapieën ontwerpen.

We hebben in de loop van de jaren publiekelijk beschikbare catalogi van duizenden eiwitcodes doorzocht. We hebben deze grote dataset opgesplitst in twee: normale zelf-eiwitcodes afgeleid van gezonde menselijke cellen en abnormale eiwitcodes afgeleid van virussen, tumoren en bacteriën. Daarna hebben we ons gekeerd naar een kunstmatig neuraal netwerk dat is ontwikkeld in ons laboratorium.

Nadat we de eiwitcodes hadden ingevoerd in de ANN, kon het algoritme identificeren fundamentele verschillen tussen normale en abnormale proteïne-codes. Het zou moeilijk zijn voor mensen om dit soort biologische verschijnselen bij te houden - er zijn letterlijk duizenden van deze eiwitcodes te analyseren in de big data set. Er is een machine voor nodig om deze complexe problemen op te lossen en nieuwe biologie te definiëren.

Voorspellingen via machinaal leren

De belangrijkste toepassing van machine learning in de biologie is het nut ervan in het maken van voorspellingen op basis van big data. Op computer gebaseerde voorspellingen kunnen betekenis geven aan big data, hypothesen testen en kostbare tijd en middelen besparen.

In ons vakgebied van de T-celbiologie bijvoorbeeld, is het van cruciaal belang om te weten welke virale eiwitcodes doelgericht zijn bij het ontwikkelen van vaccins en behandelingen. Maar er zijn zoveel individuele eiwitcodes van een bepaald virus dat het erg duur en moeilijk is om elk van hen te testen.

In plaats daarvan hebben we het kunstmatige neurale netwerk getraind om de machine te helpen alle belangrijke biochemische kenmerken van de twee soorten eiwitcodes te leren - normaal versus abnormaal. Vervolgens vroegen we het model om te "voorspellen" welke nieuwe virale eiwitcodes lijken op de "abnormale" categorie en zouden kunnen worden gezien door T-cellen en dus het immuunsysteem. We hebben het ANN-model getest op verschillende viruseiwitten die nog nooit eerder zijn bestudeerd.

Zeker, als een ijverige student die graag de leraar wil plezieren, was het neurale netwerk in staat om de meerderheid van dergelijke T-celactiverende eiwitcodes binnen dit virus nauwkeurig te identificeren. We hebben ook experimenteel de eiwitcodes getest die het markeerde om de nauwkeurigheid van de voorspellingen van ANN te valideren. Met dit neurale netwerkmodel kan een wetenschapper het dus snel voorspellen alle belangrijke korte eiwitcodes van een schadelijk virus en test ze om een ​​behandeling of een vaccin te ontwikkelen, in plaats van ze individueel te raden en te testen.

Implementatie van Machine Learning Wisely

Dankzij voortdurende verfijning worden big data science en machine learning steeds onmisbaarder voor elk soort wetenschappelijk onderzoek. De mogelijkheden om computers te gebruiken om te trainen en te voorspellen in de biologie zijn bijna eindeloos. Van het uitzoeken welke combinatie van biomarkers het beste is voor het detecteren van een ziekte tot het begrijpen waarom alleen sommige patiënten hebben baat bij een bepaalde kankerbehandeling, het ontginnen van big data sets met behulp van computers is een waardevolle route voor onderzoek geworden.

Natuurlijk zijn er beperkingen. Het grootste probleem met big data science zijn de gegevens zelf. Als gegevens verkregen door -omics-onderzoeken om te beginnen defect zijn, of gebaseerd zijn op slechte wetenschap, zullen de machines worden getraind op slechte gegevens - wat leidt tot slechte voorspellingen. De student is alleen zo goed als de leraar.

Omdat computers niet bewust zijn (nog), kunnen ze in hun zoektocht naar patronen met ze komen, zelfs wanneer ze niet bestaan, opnieuw aanleiding geven tot slechte gegevens en niet-reproduceerbare wetenschap.

En sommige onderzoekers hebben hun bezorgdheid geuit over het ontstaan ​​van computers zwarte dozen met gegevens voor wetenschappers die de manipulaties en machinaties die ze namens hen uitvoeren niet goed begrijpen.

Ondanks deze problemen blijven de voordelen van big data en machines hen waardevolle partners in wetenschappelijk onderzoek. Met de kanttekeningen in het achterhoofd, zijn we op een unieke manier klaar om de biologie te begrijpen door de ogen van een machine.

Over de auteurThe Conversation

Sri Krishna, PhD Candidate, Biological Design, School of Biological and Health Systems Engineering, Arizona State University en Diego Chowell, PhD Student in Applied Mathematics, Arizona State University

Dit artikel is oorspronkelijk gepubliceerd op The Conversation. Lees de originele artikel.


Verwante Boek:

at InnerSelf Market en Amazon