Cloud lader forskere bygge deres egen virtuelle supercomputer
Brugerne af supercomputeren Computerome kan nu konstruere en virtuel supercomputer skræddersyet til deres egne behov. Ny cloud-løsning giver mulighed for at flytte beregninger ud til data.
”En forsker kan definere sin egen supercomputer med et bestemt antal CPU-kerner, en vis mængde memory og lager. Dermed kan forskeren optimere sit setup til det problem, der skal løses. Og den virtuelle computer kan tilpasses undervejs, hvis der bliver brug for det,” fortæller Peter Løngreen fra Center for Biological Sequence Analysis ved Danmarks Tekniske Universitet (DTU CBS).
Cloud-softwaren bygger dels på open source-teknologien OpenStack, dels på software, som DTU CBS selv har udviklet.
Centeret har designet Computerome ud fra input fra over 100 forskere inden for life-science-området. Derfor er det en supercomputer, der er målrettet til de særlige krav, det område stiller. Den befinder sig i to containere på DTU Risø.
Flyt beregninger ud til data
”Muligheden for at opbygge egne virtuelle clustre er kun første skridt ind i cloud-verdenen. I fremtiden vil cloud gøre det muligt at flytte beregningerne ud til data i stedet for som nu, hvor vi flytter data til regnekraften,” fortæller Peter Løngreen.
Det bliver muligt, fordi forskeren kan lagre den samlede definition af en virtuel supercomputer. Det image kan flyttes over til en anden supercomputer og afvikles der.
Det løser et stort problem inden for bio-informatikken: Data vokser så hurtigt og til så store mængder, at det bliver umuligt at flytte rundt på dem.
Således fordobles mængden af data, som forskningen inden for såkaldt next generation sequencing genererer, hvert halve år.
”Via virtualiseringsteknologier kan vi flytte opgaver ud til de steder, hvor data befinder sig. Så hvis en dansk forsker vil regne på data, der ligger på en udenlandsk supercomputer, kan vedkommende danne et virtuelt cluster herhjemme og køre det på den udenlandske computer,” forklarer Peter Løngreen.
Peter Løngreen:
I fremtiden bliver udviklingen inden for medicin og hele vores sundhedssystemet datadrevet. Derfor er det vigtigt, at forskerne får effektive værktøjer til at behandle data.
Løser problem med følsomme data
Det løser også et andet problem: Nogle data er underlagt persondatalovgivning, fordi de indeholder følsomme oplysninger om personlige forhold. Det kan være lettere for forskere at få adgang til at arbejde med dem, når de bliver liggende på den udenlandske computer og ikke skal kopieres over på en dansk server.
Peter Løngreen regner med, at den nye cloud vil effektivisere forskningen:
”Vi forventer, at indførelsen af cloud vil få forskerne til at bruge workbenches. Det er virtuelle setups, som en forsker stiller til rådighed for sine kolleger. Det kan gøre nye workflows tilgængelige hurtigere, så hele forskningsforløbet bliver mere effektivt,” siger Peter Løngreen.
Et hold på en halv snes it-branchefolk, forskere og teknikere har udviklet cloud-platformen til Computerome gennem to et halvt år.
”Vores designfilosofi er, at det her skal være så professionelt, at det kan anvendes i industrien. Dermed skal vi kunne leve op til branchens krav til for eksempel datasikkerhed og oppetid,” siger han.
Cloud-platformen er tilgængelig for alle brugere af Computerome. Bag Computerome står DeiC, DTU og Københavns Universitet.
Læs mere
DeiC Nationale LifeScience Supercomputer, DTU
Computerome - Danish National Supercomputer for Life Sciences