Prestaties databases factor 100 sneller
De prestaties van moderne computers verbeteren snel. Databasetechnologie was tot nu toe niet in staat optimaal te profiteren van die verbeterde hardwareprestaties. Dat maakt dat databases voor intensieve toepassingen ongeschikt zijn. Zukowski’s methode creëert daarom nieuwe toepassingsgebieden voor databasetechnologie. Bijvoorbeeld het zoeken naar trefwoorden in grote hoeveelheden ongestructureerde data.
Het belangrijkste deel van Zukowski's systeem is een nieuwe benadering om data te verwerken: het vectorized in-cache execution model. Dit haalt in de hardware interne vertragingen weg tijdens de dataverwerking. “Vergelijk het maar met het halen van bier voor een feestje,” zegt de promovendus. “Iemand kan één flesje bier halen in de winkel, dat thuis in de koelkast stoppen en dan steeds opnieuw naar de winkel gaan voor het volgende flesje. Wat wij doen kun je vergelijken met iemand die in een keer twee kratten bier ophaalt. Dat is veel efficiënter."
Hiertoe maakte hij wijzigingen in het operator pipeline model dat in de meeste databases voorkomt. Voordelen zijn de verbeterde schaalbaarheid en de hoge prestaties bij bulkverwerking van data. "Uit benchmark test bleek dat de performance toenam met ordes van grootte, vaak met een factor 100 of meer", aldus Zukowski. Het beheersen van de data-explosie is een van de speerpunten van het CWI.
Zukowski promoveert op 11 september 2009 aan de Universiteit van Amsterdam op zijn proefschrift 'Balancing Vectorized Query Execution with Bandwith-Optimized Storage'.
Reacties
Om een reactie achter te laten is een account vereist.
Inloggen Word abonnee