Publikationer for perioden 2015-2018
Siden etableringen af de nationale HPC anlæg i 2014 og 2015 har antallet af videnskabelige publikationer kun været stigende. Denne analyse blev første gang offentliggjort i DeiCs årsrapport for 2017, hvor ialt 290 publikationer blev registreret for perioden 2015-2017. Senere blev 60 publikationer efterregisteret for 2015-2017 og yderligere 226 publikationer er noteret for året 2018. Listen tæller således nu 576 publikationer for perioden 2015 til 2018, dvs. en fireårig periode.
Denne oversigt tegner et landskab af de videnskabelige publikationer som har inkluderet regnekraft fra et af de tre nationale HPC-anlæg hhv. indenfor Life Science (Computerome), multidiciplinær forskning (ABACUS2.0) samt samfundsvidenskab og humaniora (Kulturarvsclusteret).
Indhold på siden
- Indsamling af publikationer
- Nyt på den nationale liste
- Antal og fagområder
- Diversitet og gennemslagskraft
- Samarbejdsmønstre
- Hot topics in DK-HPC
- Fun facts
- Præsentation ved DeiC konferencen 2019
Indsamling af publikationer
Næsten 600 publikationer synliggør brugen af national HPC i dansk forskning i perioden 2015 til 2018, og dette billede kan ikke tegnes på normal bibliografisk vis. Mindre end 20% af publikationerne "fanges" ved en bibliometrisk søgning (Det er ikke skrevet i ”Acknowledgement” eller ”Funding” feltet i publikationen), og derfor har de nationale HPC brugere efterfølgende skulle angive specifikt, hvilken regnekraft de har benyttet.
I denne analyse er hver enkelt publikation blevet verificeret af HPC brugerne, for at få et retvisende billede af hvor mange publikationer, der reelt har inkluderet national HPC.
Nyt på den nationale liste
Listen inkluderer nu også publikationer fra samfundsvidenskab og humaniora, hvilket er nyt i forhold til analysen for 2015-2017. Det er især ABACUS2.0 der har været supercomputeren bag samfundsvidenskab og arkæologi (Fig. 1, Reference 2-7). Kulturarvsclusteret, også kaldet KAC, har været operationsdygtig siden 2018, og der forventes publikationer, der har inkluderet brug af KAC, i de kommende år. Dog har en forsker allerede kigget på det danske world-wide-web ved brug af KAC (Fig. 1, Reference 1). Hør om professor Niels Brüggers forskning i det danske web (Podcast) eller læs mere her (Nyhed).
Oversigt over publikationer sorteret efter årstal findes her (De første 500): PUB_ÅRSTAL
Figur 1. Publikationer indenfor samfundsvidenskab og humaniora der inkluderede national HPC i perioden 2015 til 2018.
Antal og fagområder
- Siden lanceringen af de nationale HPC-anlæg, er der alene i 2017 og 2018 genereret 450 publikationer, der inkluderede brug af national HPC (Fig.2).
- De fleste HPC brugere ligger indenfor forskningsområderne Biologi (Blå, 29%), Kemi & Biokemi (Orange, 16%) samt Medicin (Gul, 30%) (Fig. 3A).
- Det ses, at den nationale HPC arkitektur understøtter hhv. Life Sciences forskning via COMPUTEROME (Fig. 3B) og multidiciplinær forskning via ABACUS2.0 (Fig. 3C). Kulturarvsclusteret, KAC, er designet til at understøtte hhv. humaniora og samfundsfag (Fig. 3D, Pt. kun én publikation).
- Regnekraft via ABACUS2.0 har især genereret publikationer indenfor disciplinerne Kemi & Biokemi, Fysik samt Computerscience & AI (Fig.4A).
- Regnekraft via COMPUTEROME har især genereret publikationer indenfor disciplinerne Biologi og Medicin (Fig.4B).
- Det samlede antal af publikationer er fordoblet fra 290 til nu 576 siden analysen blev foretaget første gang i 2017 (Fig.5).
Figur 2. Samlet antal af videnskabelige publikationer pr. år pr. nationale HPC anlæg for perioden 2015 til 2018 (N=576). Mørkeblå, Publikationer fra ABACUS2.0. Orange, Publikationer fra COMPUTEROME.
Figur 3. A. Fordeling (%) af 576 videnskabelige publikationer i perioden 2015 til 2018, der anvendte High Performance Computing (HPC) fra nationale anlæg i DK. Angivelse af forskningsområde for tidsskriftet, som der blev publiceret i (Journal Impact Factor Kategori).
B. Andel af publikationer der har inkluderet regnekraft fra COMPUTEROME opdelt efter fagområde.
C. Andel af publikationer der har inkluderet regnekraft fra ABACUS2.0 opdelt efter fagområde.
D. Andel af publikationer der har inkluderet regnekraft fra KAC opdelt efter fagområde.
Figur 4. Cumulativt plot af antal publikationer i perioden 2015 til 2018 der har inkluderet brug af national HPC pr. år - Sorteret pr. fagområde pr. HPC anlæg.
Figur 5. Antal af videnskabelige publikationer pr. år der blev indsamlet til analysen i hhv. 2017 og 2018. Data er baseret på bruger verificering af hver enkelt publikation, og kan ikke genskabes gennem en bibliometrisk søgning, da det ikke er angivet i ”Acknowledgments” eller ”funding” feltet for 80% af publikationerne.
Diversitet og gennemslagskraft
Her er information om synlighed og gennemslagskraft for de 576 publikationer, der inkluderede national HPC i perioden 2015 til 2018. Dette er belyst ved hjælp af feltvægtede citationer for publikationerne samt andel af publicering i top 10% mest citerede på verdensplan. Diversitet henviser til hvor bredt forskningsresultater er formidlet gennem forskellige tidsskrifter.
FWCI
I analysen for 2015 til 2018 benyttes parameteren feltvægtet citations index (FWCI) for hver enkelt publikation fra databasen Scopus og metrics modulet SciVal. FWCI er andelen af totale citationer for et givent antal publikationer divideret med det forventede antal citationer baseret på gennemsnittet for det pågældende videnskabelige område. Et FWCI på 1 lever op til det globale gennemsnit. For FWCI>1 er citationsgraden højere end forventet ift det globale gennemsnit. For FWCI<1 er citationsgraden mindre end det globale gennemsnit. En score på 1.6 betyder at publikationerne fik 60% flere citationer end verdens gennemsnittet for disciplinen.
JIF
En måde at rangere internationale tidsskrifter på, hvori videnskab publiseres (publikationer) er at måle på et citations index vha. JIF (Journal Impact Factor). En JIF på f.eks. 3 henviser til at i gennemsnit citeres videnskabelige publikationer fra pågældende tidsskrift 3 gange baseret på data fra de sidste to år. Det anskues at jo højere JIF for et tidsskrift jo mere videnskabeligt anset er pågældende publikation (McVeigh et al. (2009)).
- I alt 38.9% af publikationerne er at finde i de top 10% mest citerede publikationer i verden for 2015 til 2018 (Fig. 6A), hvilket er en høj rate. Dette bidrager til at øge gennemsnittet for Danmarks samlede bestand af publikationer i top 10% mest citerede på verdensplan, som i Forskningsbarometret 2018 var anslået til 19.4% for 2013 til 2017.
- I alt 36.5% af publikationerne er synliggjort i top10% af de mest citerede tidsskrifter på verdensplan (Fig. 6A).
- Den gennemsnitlige FWCI er 3,53 for de 576 publikationer der inkluderede DK-HPC, hvilket er højere end det globale gennemsnit og højere end det samlede antal af publikationer i DK (Fig. 6A).
- Publikationsanalysen for 2015-2018 viser højere felt-vægtet citations gennemslagskraft sammenlignet med total DK, Norden og OECD for 4 ud af 6 fagområder (Fig. 6B, Grøn kurve DK-HPC). Der er hidtil blot registreret 7 publikationer fra samfundsvidenskab og humaniora, hvilket kan forklare lav FWCI for disse områder.
- De 576 publikationer var tilgængelige i 299 forskellige internationale tidsskrifter. Dette understreger stor diversitet i udbredelse af forskningsresultaterne, da analysen fra 2015 til 2017 identificerede 290 publikationer i 168 tidsskrifter. Det indikerer, at det prioriteres at formidle sin forskning internationalt så bredt som muligt i nye tidsskrifter.
- I alt 99 publikationer (17%) er udgivet i højt anerkendte tidsskifter med JIF værdier over 10 (Tabel 1, Fig. 7). Ti publikationer er tilgængelige i tidsskriftet Nature og 5 stk. i Science. Desuden er der nu to publikationer i New England Journal of Medicine, som har en JIF på 70.
- En høj JIF score for tidsskriftet, hvori publikation er udgivet, er ikke ensbetydende med en høj synlighed (FWCI) for den enkelte publikation (Fig. 8 og 9, Top10 publikationer med angivelse af FWCI og JIF). Det ses f.eks. at de to mest citerede publikationer indenfor Life Science (FWCI>100) er fra tidsskrifter med JIF på 10, mens nr. 4 på listen er publiceret i tidsskrift med JIF på 70 (Fig. 8). Samme tendens ses for publikationerne udenfor Life Science området, hvor fysik er repræsenteret for hhv. Top1 (FWCI >15, JIF 5,3) og Top2 (FWCI >10, JIF 0,26), mens Top5 indenfor materialelære har FWCI på 8 og JIF på 6,8 (Fig. 9).
Figur 6. Feltvægtet gennemslagskraft (FWCI) af publikationer fra 2015 til 2018 der inkluderede brug af DeiC national HPC. Data fra SciVal (Scopus). A. Øverst: Andel af publikationer i hhv. Top10 mest citerede i verden og Top10 tidsskrifter. SNIP (Top10% Journals); Source normalized impact per publication (SNIP citationer er normaliseret for at korrigere forskelle i citations praksis mellem videnskabelige områder). Nederst: FWCI gennemsnit for det samlede antal publikationer. B. FWCI fordelt på fagområde og sammenligning af DK-HPC (N=576) med hele samlingen af publikationer inden for området for Danmark, Norden og OECD landene.
Tabel 1. I alt 99 ud af de 576 publikationer der inkluderede national HPC (17%) er udgivet i 33 tidsskrifter indenfor Life Science området med JIF>10. Angivelse af international tidsskrifts rangering ved JIF, Journal Impact Factor (2017).
Figur 7. Fordeling af DK-HPC publikationerne med JIF>10. Størrelse af cirkel angiver antal.
Links til Top10: 1, Szklarczyk, D. et al. (2015); 2, Szklarczyk, D. et al. (2017); 3, Wray, N.R. et al. (2018); 4, Manrai, A.K. et al. (2016); 5, Huerta-Cepas, J. et al. (2016); 6, Anttila, V. et al. (2018); 7, Gandal, M.J. et al. (2018); 8, Rebelo, A.R. et al. (2018); 9, Pedersen, H.K. et al. (2016); 10, Bekker-Jensen, D.B. et al. (2017).
Figur 9. Top10 mest citerede publikationer fra de 576 publikationer, der inkluderede national HPC i perioden 2015 til 2018, indenfor fysik- (Mørkegrøn) og miljø/energi (Blå) området, samt materialelære (Mellemgrøn) og Computer Science & AI (Lysegrøn). Se figur tekst fra Fig. 8.
Links til Top10: 1, Aoki, S. et al. (2017); 2, Drach, V. et al. (2018); 3, Papior, N. et al. (2017); 4, Cruz-Filipe, L. et al. (2017); 5, Boroviks, S. et al. (2018); 6, Ding, F. et al. (2017); 7, Cruz-Filipe, L. et al. (2017); 8, Hansen, M. et al. (2018); 9, Alexandersen, J. et al. (2018); 10, Ding, F. et al. (2016).
Samarbejdsmønstre
- KU (n=262 af de 576 publikationer), DTU (n=199) og SDU (n=195) havde forfatterskabet på hovedparten af publikationerne, der inkluderede national HPC (Fig. 10). Andel af publikationer der udelukkende kom fra institutter fra et af de 8 universiteter er angivet med blåt, mens publikationer der inkluderede samarbejde på tværs af danske universiteter er angivet med orange.
- I gennemsnit var der i 67% af publikationerne internationalt samarbejde fordelt over 83 lande via mere end 3000 forsknings enheder fordelt på mere end 500 unikke institutioner (Fig. 11A). Samarbejdsmønstre pr. universitet ses i Fig. 11B i alfabetisk rækkefølge, og andelen af publikationer hvori det enkelte universitet er medforfatter på publikationen er angivet i Fig. 11C.
- Industri var repræsenteret i 12% af publikationerne, der inkluderede national HPC og sektorforskning var repræsenteret i 23% af publikationerne (Fig. 12A). I alt 194 publikationer, svarende til de 35% der inkluderede samarbejde med industri eller sektorforkning, akkumulerede over en fire-årig periode (Fig. 12B).
Figur 10. Antal gange de respektive danske universiteter har forfatterskab på de i alt 576 publikationer, der inkluderede national HPC. Blå farve, Kun institutter fra pågældende universitet. Orange farve, Samarbejde med andre danske universiteter. I denne del af analysen er der +/- samarbejde med udland og/eller industri indenfor begge kategorier.
Figur 11. A. Internationalt samarbejde fordelt over 83 lande via mere end 3000 forsknings enheder. B. Samarbejdsmønstre pr. universitet i alfabetisk rækkefølge. C. Andelen af publikationer hvori det enkelte universitet er medforfatter blandt de 576 publikationer i denne analyse.
Figur 12. A. Samarbejde med industri og sektorforsknings institutioner opgjort ved forfatterskab i 576 publikationer, der inkluderede brug af national HPC. B. Andel af publikationerne pr. år der inkluderede samarbejde med industri eller sektorforskning (I alt 194 publikationer svarende til 35%).
Hot topics in DK-HPC
- Nedenfor er vist en mere detaljeret oversigt over videnskabelige discipliner, der har brugt DeiC national HPC fra 2015 til 2018 (Fig. 13). Det ses at publikationer fra Computerome især henføres til life science og naturvidenskab (Røde cirkler, Fig. 13A). Publikationer fra ABACUS2.0 henføres til især computer science og fysik (Blå og lilla cirkler), men også social scienes er repræsenteret (Gule cirkler, Fig. 13B).
- Beskrivelse af ”Topic prominence Clusters” for hhv. ABACUS2.0 og Computerome findes i hhv. Tabel 1 og 2.
- Du kan finde flere detaljer i rapporten: LINK
Tabel 1. Top10 Topic Prominence Clusters for publikationer der har benyttet regnekraft fra COMPUTEROME (N=385) i perioden 2015 til 2018.
Tabel 2. Top10 Topic Prominence Clusters for publikationer der har benyttet regnekraft fra ABACUS2.0 (N=190) i perioden 2015 til 2018.
Fun facts
- Der er meget bevågenhed på ”Open Science”, men hvor mange publicerer egentlig deres resultater i et åbent tidsskrift?
I alt 59% af publikationerne i denne analyse er ”Open Access” ifølge Scopus. Dette indbefatter at publikationen enten a) er publiceret i et åbent tidsskrift eller b) der er betalt for at gøre publikationen åbent tilgængelig eller c) der er lavet en parallel publicering som frit tilgængeligt re-print ved siden af udgivelsen i et tidsskrift. - Hvilket videnskabeligt emne eller værktøj er mest belyst i de 576 publikationer?
I alt 54% af publikationerne inkluderede genom analyse vha. regnekraft på en national supercomuter. Genom analyser var benyttet på områder så som (Fig. 14):- Det humane genom. F.eks. diagnostisering og årsager til hjertekar sygdomme, kræft og diabetes, men også analyse af tarmflora (Microbiome), tvillingers genomer, urtidsmenneskers forekost og epigenetisk udtryk af det menneskelige genom m.m.
- Genomer fra plante og dyreriget. F.eks. kortlægning af genomer for mink, ulv og hest samt honningbi, gedehams og plante-ædende insekter.
- Genomer fra virus og bakterier. F.eks. microbiome fra mennesker og dyr, virus i spildevand, spredning af infektions sygdomme og antimikrobiel resistens fra toiletaffald i fly samt metagenomics af Grønlands isen.
- Hvor meget anvendes åbent software som f.eks. ”R” i de videnskabelige publikationer?
Ialt 20% af publikationerne inkluderede brug af ”R”, og mere end 100 unikke R-pakker var anvendt til data analyse. Se evt. tidligere analyse af R pakke landskabet HER.
Figur 15. Emner der har inkluderet genom analyse i 54% af publikationerne i denne analyse. Wordart lavet fra publikationernes titler.
Præsentation ved DeiC konferencen 2019
Præsentationen fra DeiC konferencen 2019 finder du her: