Inhoudsopgave:
- Een snel vooruitlopend veld
- Ingebouwde redundantie en de noodzaak van foutcorrectie
- Verzilveren - Elke dag nu
Video: How we can store digital data in DNA | Dina Zielinski (November 2024)
Ingenieurs pushen al tientallen jaren met succes meer opslag in kleinere ruimtes, maar dat kan niet eeuwig doorgaan. De volgende grote sprong in gegevensopslag kan de vorm aannemen van het DNA in alle organische materie: wetenschappers in laboratoria in het hele land experimenteren met synthetisch DNA als opslagmedium.
"Als je kijkt naar waar elektronica naartoe gaat, siliciumtechnologie, veel van de basistechnologie die we tegenwoordig gebruiken om computers te bouwen, naderen we de limiet in bijna allemaal", zegt Luis Henrique Ceze, universitair hoofddocent informatica en engineering aan de Universiteit van Washington. "DNA is erg dicht, het is zeer duurzaam en het kost heel weinig energie om te onderhouden, dus er is veel voordeel van het gebruik van DNA voor gegevensopslag."
Ceze werkte samen met Karin Strauss, een onderzoeker op het gebied van computerarchitectuur bij Microsoft Research, aan een samenwerking tussen de twee instellingen - een project dat computerwetenschap en biologie overbrugt. Voor een team van ongeveer 20 mensen levert de universiteit de moleculaire biologen en Microsoft levert de computerwetenschappers.
Om te begrijpen hoe DNA kan worden gebruikt voor opslag, moet u er rekening mee houden dat alle computergegevens binair of base-2 zijn. DNA is base-4, samengesteld uit adenine, cytosine, guanine en thymine (afgekort als A, C, G en T). De eerste stap is het converteren van base-2-informatie naar base-4, dus A komt overeen met 00, C tot 01, G tot 10 en T tot 11 (dat vereenvoudigt het een beetje maar komt op het idee).
Vervolgens gebruiken wetenschappers een machine genaamd een DNA-synthesizer om de vier chemicaliën in de juiste volgorde te combineren. Het resultaat slaat de informatie vele malen op als een zoutachtig cluster kleiner dan de punt van een potlood. Het teruglezen van die informatie vereist een DNA-sequencer.
Hoewel dit misschien fragiel klinkt - als iets dat kan wegblazen wanneer een deur plotseling opent - is DNA het sterkste medium voor gegevensopslag dat we hebben gezien. Wetenschappers hebben met succes DNA gelezen dat honderdduizenden jaren oud is.
Sequencing-DNA omvat het verwijderen van een klein beetje van het opgeslagen materiaal en het proces put dat monster uit. Bijgevolg kan een DNA-opname een eindig aantal keren worden gelezen. Dat is echter geen probleem, omdat het opgeslagen materiaal zoveel redundante gegevens bevat; het kan steeds opnieuw worden bemonsterd. De opslagmedia van vandaag hebben ook een beperkt aantal schrijf- en leescycli voordat ze falen, dus dit is niets nieuws.
Zoals Ceze aangeeft, zal DNA nooit verouderd zijn. Terwijl velen van ons diskettes achter in een la hebben die we niet langer kunnen lezen, is dat niet het lot van DNA. "We gaan altijd om DNA geven vanwege biowetenschappen en gezondheidsredenen, dus je zult altijd een manier hebben om informatie te lezen die is opgeslagen in DNA, " zegt Ceze.
In juli 2016 codeerden Microsoft en de Universiteit van Washington met succes 200 MB aan gegevens in DNA-vorm, waarmee het vorige record van 22 MB werd overtroffen. Met behulp van DNA, zegt Strauss, is het mogelijk om 1 exabyte aan gegevens - dat is 1 miljard GB - op te slaan in een kubus van 1 inch.
"We hebben een schatting gemaakt van hoeveel data je in een bepaald volume zou kunnen stoppen", zegt Strauss. "We probeerden in te schatten wat het volume zou zijn als we vandaag zouden besluiten het volledige toegankelijke internet te archiveren, dat wil zeggen alles wat niet achter een wachtwoord of een andere elektronische muur zit, en we kwamen op het formaat van een grote schoenendoos."
Dat klinkt als een verre propositie, maar Ceze gelooft dat we over tien jaar commerciële DNA-opslagsystemen op de markt zullen zien. Ze werken niet precies zoals microprocessor-opslag, omdat DNA een natte chemische omgeving vereist voor het maken, maar ze bieden enorme capaciteit en willekeurige toegang met dezelfde snelheden die enterprise tapesystemen nu bieden.
Een snel vooruitlopend veld
DNA bestaat al miljarden jaren, maar demonstraties van DNA als bruikbare opslagtechnologie begonnen in 1986 toen MIT-onderzoeker Joe Davis een eenvoudig binair beeld codeerde in 28 basenparen DNA.
Een andere pionier op dit gebied is George Church, een professor in de genetica die sinds 1977 aan de Harvard Medical School werkt en sinds 1986 zijn eigen laboratorium runt. Church is geïnteresseerd in het verlagen van de kosten van het lezen en schrijven van DNA sinds de jaren 1970, ervan overtuigd dat ooit ze zouden samenkomen om praktische gegevensopslag te creëren. Hij raakte geïnteresseerd in het werken aan DNA-onderzoek rond 2000 en voerde kritische sequencing- en synthesetests uit in 2003 en 2004. Tegen 2012 was hij in staat om beide gebieden samen te brengen en een systeem voor het coderen van gegevens te creëren. Hij schreef dat werk in een invloedrijk artikel in 2012 in Science .
"Vóór 2003 en '04 werden sequentiëring en synthese hoofdzakelijk gedaan in capillairen - of kleine buisjes - waar je één buis per reeks zou hebben, " legt Church uit. "Het was behoorlijk handmatig en niet schaalbaar. De les die we hadden geleerd van de microfabricage-halfgeleiderindustrie was dat je een manier moest bedenken om ze in wezen in een tweedimensionaal vlak te plaatsen en vervolgens de functiegrootte te verkleinen. Geen van beide Kolomgebaseerde methoden waren daarmee compatibel, en daarom hebben we in 2003 laten zien hoe je sequenties op een tweedimensionaal vlak kunt distribueren en deze vervolgens kunt weergeven met fluorescerende beeldvorming, wat nu de dominante manier van sequencing is. Toen hebben we in 2004 aangetoond dat je zou DNA op een vliegtuig kunnen maken en het er dan af kunnen glijden, en dan zou het nog compacter kunnen zijn, dus het vliegtuig was slechts een tijdelijke plek om ze te synthetiseren. Vervolgens kon je ze samenpersen in een driedimensionaal object dat miljoenen keren compacter dan normale gegevensopslag.
"Dat waren bewijzen van conceptoefeningen in 2003 en 2004. In 2012 hadden wij en anderen de lees- en schrijfmethoden voor DNA verfijnd en ik heb ze samengevoegd in één experiment waarin ik een boek codeerde dat ik net in DNA had geschreven, inclusief afbeeldingen, waaruit blijkt dat in principe alles wat digitaal is, kan worden gecodeerd met DNA."
Hoewel kosten een belangrijke hindernis vormen voor DNA-opslag, merkt Church op dat de prijs sterk is gedaald in de korte tijd dat onderzoek is gedaan. De kosten voor het lezen van DNA zijn ongeveer 3 miljoen maal verbeterd, terwijl de kosten voor het schrijven met een miljard zijn verbeterd. Hij kan beide in nog minder tijd met nog een miljoenvoud zien verbeteren. Hij wijst er ook op dat de kosten voor het kopiëren van DNA-materiaal bijna gratis zijn, evenals de kosten voor langdurige opslag. Voor archiefopslag zijn de kosten van het lezen van gegevens geen groot obstakel, omdat veel gearchiveerd materiaal nooit wordt gelezen en sommige items selectief worden gelezen. Kijk naar de kosten van het hele systeem, adviseert hij. Traditionele opslagmethoden bewegen met de snelheid van Moore's wet en zullen binnenkort platvallen. Maar DNA-opslagtechnologie beweegt sneller dan de wet van Moore en vertoont geen tekenen van plateauvorming.
Bij archivering en cloudopslag ziet Church eerst DNA-gegevensopslag. Bedrijven zoals IBM, Microsoft en Technicolor hebben hun eigen onderzoeks- en ontwikkelingsteams die het gebied bestuderen, merkt hij op. Hij werkte in 2015 samen met Technicolor om A Trip to the Moon op te slaan, een klassieke film uit 1902 die ooit als verloren werd beschouwd, voor DNA. Technicolor heeft nu veel DNA-kopieën die samen niet groter zijn dan een stofje.
Church heeft een lab van 93 mensen die werken aan DNA-opslag en zich momenteel richten op twee doelen. De eerste is om de snelheid per cyclus radicaal te verbeteren. Informatie wordt opgeslagen in honderden lagen, elk zo dik als een molecuul. Elke toevoeging duurt momenteel drie minuten, maar Church gelooft dat dit kan worden teruggebracht tot minder dan een milliseconde. Dat is 200.000 keer sneller, merkt hij op, en betekent een verandering van organische chemie naar biochemie. Hij wil ook veranderen hoe de instrumenten die worden gebruikt voor lezen en schrijven worden vervaardigd om ze veel kleiner te maken. Momenteel zijn ze zo groot als grote koelkasten. Hij wil dat verkleind worden.
Ingebouwde redundantie en de noodzaak van foutcorrectie
Een onderzoeker die werd beïnvloed door Church's Science- artikel uit 2012 is professor Olgica Milenkovic van de Universiteit van Illinois, Urbana-Champaign. Het artikel noemde de behoefte aan codering, wat meteen haar interesse opwekte. Codering in opslagonderzoek is een techniek voor het toevoegen van redundantie aan gegevens, redundantie die later kan worden gebruikt om fouten te corrigeren die optreden tijdens het lees- en schrijfproces. Zie de twee Citizen Kane-foto's hier voor een voorbeeld van waarom dit belangrijk is. Beiden werden gecodeerd in DNA door het team van Milenkovic en vervolgens gelezen. Raad eens welke iemand redundantie gebruikte.
Je hebt gelijk: de linkerafbeelding was gecodeerd met redundantie en de rechterafbeelding niet.
Een eenvoudige manier om redundantie toe te voegen, is elk teken een bepaald aantal keren herhalen. In plaats van een 0 te schrijven, schrijft u deze vier keer. Dat is de brute-force benadering - eenvoudig maar vreselijk inefficiënt. Het werk van Milenkovic gaat over het op een meer geavanceerde manier bereiken van dezelfde foutcorrectie. Het omvat technieken die pariteitscontroles of lineaire congruentiecontroles worden genoemd om manieren te bieden om gegevens te verifiëren.
"Het hele veld is in feite bedoeld om u te helpen bij het corrigeren van fouten als ze verschijnen of, beter nog, om fouten te voorkomen waarvan u weet dat ze zeer waarschijnlijk zullen verschijnen, " zegt Milenkovic. "We introduceren gecontroleerde redundantie om van fouten af te komen, en die gecontroleerde redundantie is niet in de vorm van eenvoudige herhaling, omdat dat erg ineffectief is."
Dat is wat Milenkovic in het veld bracht, maar haar onderzoek gaat nu over het verlagen van de enorme kosten van DNA-synthese.
"Mijn student, H. Tabatabae Yazdi, die erg actief was over dit onderwerp, en ik heb heel hard geprobeerd een slimme manier te bedenken om te voorkomen dat DNA wordt gesynthetiseerd. Synthese van DNA is absoluut een bottleneck voor deze technologie vanwege de hoge kosten, "Zegt Milenkovic.
Hoewel Milenkovic wantrouwend is om te veel te onthullen over niet-gepubliceerd onderzoek, omvat haar oplossing "sluwe wiskundige benaderingen" en gaat het allemaal om timing, waarbij de grootte van het interval tussen stukjes informatie zinvol is.
"Als je afziet van de formaliteit dat je ATGC's wilt gebruiken om binaire symbolen op een bepaalde locatie echt te coderen, kun je veel slimmere en efficiëntere manieren vinden om informatie op te slaan, omdat je niet steeds opnieuw strengen hoeft te synthetiseren nogmaals, "legt Milenkovic uit. "Je kunt ze eenmaal op een bepaalde manier synthetiseren en dat gesynthetiseerde DNA vervolgens op een slimme combinatorische manier hergebruiken."
Door haar werk hoopt Milenkovic de kosten van het synthetiseren van DNA met minstens drie ordes van grootte te verlagen. Dat is nog steeds niet genoeg, merkt ze op, maar het is vooruitgang. Het draagt ook bij aan een onderzoekslijn die ze fascinerend vindt.
"Het is heel spannend, om eerlijk te zijn, om God te spelen en je eigen informatie in DNA te coderen, " zegt Milenkovic. "Het geeft een persoon een gevoel van opwinding om te weten dat je speelt met een gekozen molecuul van de natuur en het laat doen wat je wilt opslaan en coderen en informatie overbrengen naar de toekomst."
Verzilveren - Elke dag nu
Het is niet alleen maar stoffig academisch onderzoek met DNA-opslag. Helixworks, een in Ierland gevestigd bedrijf, probeert er al geld mee te verdienen. Het heeft een product op Amazon - soort van.
"We hebben Amazon gelanceerd, zodat je 512 KB aan digitale gegevens kunt krijgen die in DNA zijn gecodeerd", legt Nimesh Pinnamaneni, medeoprichter van het bedrijf, uit. "Het is iets heel kleins. Misschien een foto of misschien een gedicht, zoiets."
Het is een ongewone aankoop, maar het kan het perfecte liefdesfiche zijn voor de persoon die alles heeft, vooral als die persoon een wetenschapper is:
"Ik herinner me dat een klant ons belde. Hij wilde zijn vrouw cadeau doen - ze zijn allebei biotechnoloog - hij wilde zijn vrouw cadeau doen op hun huwelijksverjaardag. Hij wilde een bericht in DNA plaatsen en haar een DNA cadeau doen", herinnert Pinnamaneni zich. "Ze zou het DNA moeten sequencen om het bericht te kunnen lezen. Het is een vrij gecompliceerde manier om een liefdesbericht te verzenden, maar misschien is het schattig voor biotechnologen, weet je?"
Maar Helixworks liep zijn product een beetje voor op Amazon in augustus 2016, voordat het klaar was om bestellingen uit te voeren. Twee mensen kochten het bedrijf $ 199 DNADrive - een 14-karaats gouden capsule met een cluster van DNA erin - voordat Helixworks werd gedwongen zijn product te schrappen. DNADrive is nog steeds op Amazon, maar het is niet te koop.
Dat betekent niet dat Helixworks voorbij is, gewoon te enthousiast. Het is te ver gekomen om nu te stoppen. Het bedrijf begon aan de Universiteit van Borås in Zweden, waar Pinnamaneni (hierboven afgebeeld, links) en Sachin Chalapati (rechts), de andere mede-oprichter, master's degree in biotechnologie behaalden. Ze zamelden geld in voor onderzoek naar DNA-opslag, gingen door met hun werk terug in Bangalore, India en ontwikkelden een proof of concept.
Rondkijken naar extra fondsen bracht hen naar het IndieBio-versnellerprogramma van SOSV, een start-up venture capital bedrijf in San Francisco, Californië. Helixworks werd geselecteerd door het programma en won $ 50.000 in contanten en de mogelijkheid om te werken vanuit een laboratorium in County Cork, waar het de afgelopen zes maanden is geweest. Het programma omvat begeleiding bij het pitchen van een product, dat Helixworks dit jaar op het South by Southwest-festival in gebruik zal nemen, waar het zal deelnemen aan een pitchevenement.
Hoewel het produceren van gouden DNA-capsules uiteindelijk een lucratieve nevenactiviteit kan zijn, zegt Pinnamaneni dat de toekomst van zijn bedrijf ligt in de compacte DNA-printers voor thuis en op kantoor die het nu ontwikkelt. Hij wil DNA-opslag gemakkelijk en betaalbaar genoeg maken voor iedereen om te gebruiken.
"We zijn erachter gekomen dat je iets nodig hebt dat werkt als een cartridge in een printer, " legt Pinnamaneni uit. "Je hebt maar vier kleuren, en deze vier kleuren kunnen worden gecombineerd om elke mogelijke kleur te vormen, toch? Dat is hoe je inktprinter werkt. We zijn erachter gekomen dat we zoiets in ons systeem moeten hebben. We hebben een cartridge met 32 reagentia ontworpen die kunnen worden gecombineerd om elke mogelijke DNA-sequentie te vormen."
Terwijl andere laboratoria elke keer dat ze DNA moeten laten synthetiseren ongeveer $ 30.000 betalen, een operatie die weken in beslag neemt, zegt Pinnamaneni dat zijn uitvinding de kosten en tijd dramatisch kan verlagen. Helixworks werkt samen met Opentrons, een bedrijf dat geautomatiseerde laboratoriumapparatuur maakt om de printer te maken. Dat is wat het op SXSW zal pitchen.
"Wat we op de beursvloer zullen aantonen, is DNA-schrijven vlak voor je ogen, " zegt Pinnamaneni.
Het bedrijf neemt nog geen bestellingen aan. En dat is goed, want die romantische biotechnoloog wacht nog steeds op zijn verjaardagscadeau.