GeneWeb - Samenvoegen van databanken

Hier wordt uitgelegd hoe un twee databanken kan samenvoegen. Momenteel is dat nog veel (hand)werk, misschien wordt dat in de toekomst wat meer geautomatiseerd.

Het samenvoegen van twee databanken gebeurt in twee stappen:

bullet Eerst moet je een grote, nieuwe databank maken die de twee bestaande databanken bijeenvoegt.

bullet Daarna moeten de personen die twee maal voorkomen in het grote, nieuwe bestand telkens samengevoegd worden tot één persoon.

Eerste stap: de twee databanken bij elkaar voegen

Hiervoor moet je werken in een interactief venster (dos-box of xterm voor windows, respectievelijk unix).

bullet Stel dat u de databanken "appel" en "peer" wil samenvoegen. Dan moet u beide databanken eerst omvormen naar ".gw" bestanden. Typ dus het volgende:
     gwu appel > appel.gw
     gwu appel > peer.gw 

bullet Het aanmaken van de grote, nieuwe databank die zowel de gegevens van "appel" en "peer" bevat gebeurt als volgt:
     gwc appel.gw peer.gw -o fruit
De nieuwe databank heet toepasselijk "fruit". Het gebeurt wel eens dat er in deze stap fouten optreden, nl. als sommige personen zowel in de databanken "appel" en "fruit" voorkomen. Daarvoor heeft "gwc" een speciale optie "-sh". Probeer eens het volgende:
     gwc appel.gw -sh 10 peer.gw -o fruit
Als het met 10 niet lukt, probeer dan eens met 20, of 30 ...

Tweede stap: het samenvoegen van personen

We hebben nu een databank "fruit" die alle personen die in "appel" en in "peer" voorkomen, bevat. De personen die zowel in "appel" als in "peer" voorkomen zitten zelfs twee keer in de databank "fruit".

Deze "dubbele" personen moeten we samenvoegen.

In de sectie samenvoegen van personen wordt volledig uitgelegd hoe u twee "dubbele" personen kan samenvoegen.

Opgeruimd staat netjes...

Nadat u alle personen hebt samengevoegd, kunnen we nog een laatste opknapbeurt uitvoeren aan onze nieuwe databank. Immers, bij het verwijderen van personen uit een databank (dit gebeurt bij het samenvoegen van personen: de dubbels worden verwijderd), onstaan legen plaatsen in de interne voorstelling van de gegevens. Om de gegevens terug efficïent te ordenen volstaat het volgende:

Om de databank "fruit" een opknapbeurt te geven dient het volgende te gebeuren:

     gwu fruit > fruit.gw
     gwc fruit.gw -o fruit

Met het laatste bevel maakt u de databank "fruit" aan op basis van het bestand "fruit.gw". Je kan gerust een andere naam kiezen, bijvoorbeeld "gezond", als volgt:

     gwc fruit.gw -o gezond

In de sectie Onderhoud en starten met Geneweb is het werken met de bevelen "gwc" en "gwu" volledig uitgelegd. Een beetje experimenteren kan ook nooit kwaad om de commandos en hun werking beter te leren kennen.

Terugkeren naar de gebruiksaanwijzing.

© Copyright 2001 INRIA - GeneWeb