Cultivate Interactive Home Page *
*

Search Disabled

  Home | Current Issue | Index of Back Issues
  Issue 6 Home | Editorial | Features | Regular Columns | News & Events | Misc.

Het Historisch Data Warehouse

By Frans Smit - February 2002

Frans Smit past concepten toe die afkomstig zijn uit Informatie- en Kennismanagement (IKM) en van Informatie- en Communicatietechnologie (ICT) ten bate van het organiseren en toegankelijk maken van metadata over historische archieven en collecties [1].

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Inleiding

In de afgelopen decennia is een fundamentele verandering opgetreden in de mogelijkheden om de toegankelijkheid tot archieven, musea en bibliotheken te vergroten. Deze verandering komt deels voort uit de technologische vooruitgang maar voor een even belangrijk deel uit de toenemende maatschappelijke behoefte aan een transparante overheid. Veel instellingen op het gebied van cultureel erfgoed zijn bezig om een meer geïntegreerde en snellere toegang te creëren tot informatie over het historisch materiaal dat bij hen bewaard wordt.

In dit artikel wordt een generiek model voorgesteld om gegevens te bewaren en informatie te verschaffen. In dat model worden concepten als metadata en Data Warehousing op een geïntegreerde wijze toegepast. Deze schijnbaar nieuwe concepten vormen in werkelijkheid een nieuw perspectief op wat archivarissen en bibliothecarissen al sinds lange tijd doen. Dit nieuwe perspectief is echter wel nodig voor professionals op het gebied van cultureel erfgoed om de problemen en uitdagingen van het ICT-tijdperk [2] het hoofd te kunnen bieden. De technische implementatie van het model vereist een degelijke visie op de benodigde ICT-architectuur. In deze architectuur moeten belangrijke aspecten worden vastgesteld, bijvoorbeeld welke databases moeten worden gebruikt, hoe de gegevens moeten worden beheerd en welke rol internationale standaarden in deze hebben.

Het doel hiervan is het creëren en in stand houden van goede en goed georganiseerde gegevens. Deze gegevens kunnen voorzien in de informatiebehoefte van het publiek waardoor de maatschappelijke meerwaarde van de organisatie wordt gewaarborgd. Het achterliggende fundament voor die gegevens bestaat altijd uit de aanwezige kennis over het aanwezige historische materiaal.

De concepten die in dit artikel worden beschreven, dienen nog in detail uitgewerkt te worden. Ze zijn als uitgangspunt voor de verbetering van de kwaliteit en kwantiteit van dienstverlening door instellingen op het gebied van cultureel erfgoed aan het publiek naar mijn mening echter nu al uitstekend bruikbaar.

Een Informatie- en Kennismanagement Model

Voor instituten als archieven, musea en bibliotheken is het van essentieel belang om te definiëren wat de maatschappelijke meerwaarde is van het instituut, om vervolgens die meerwaarde te kunnen creëren. Deze meerwaarde bestaat meestal uit het verschaffen van accurate en toegankelijke informatie aan het publiek over de onderwerpen die tot de kerntaken van het instituut worden gerekend. Die informatie is gebaseerd op het materiaal dat wordt bewaard in het instituut, de beschikbare gegevens en de kennis over dat materiaal. In iedere organisatie is Informatie- en Kennismanagement (IKM) een belangrijk onderwerp. Voor archieven, musea en bibliotheken is een goed IKM niet minder dan een bestaansreden.

IKM omvat gegevens, informatie en kennis. IKM is niet een doel op zich, het is een noodzakelijk onderwerp voor het management om de juiste producten en diensten aan te kunnen bieden. Zoals bij andere belangrijke managementonderwerpen, bijvoorbeeld financieel management en personeelsmanagement, is het ook bij IKM nuttig om een modelmatige benadering te hanteren. Een bruikbaar IKM-model dat aansluit op ervaringen in andere bedrijfstakken kan er als volgt uitzien.

diagram 1
Diagram 1

Het uitgangspunt van dit model is dat de maatschappelijke meerwaarde van de instelling bestaat uit het onttrekken van materiaal uit die maatschappij, het selecteren van dat materiaal en het ervan voorzien met aanvullende informatie. Het resultaat is dat de klanten van de instelling (wie dat ook mogen zijn, dat is niet aan de instelling om te bepalen) meer en betere informatie dienen te krijgen over de onderwerpen waar de organisatie zich mee bezig houdt. Afhankelijk van de behoefte kunnen producten en diensten worden vernieuwd, aangevuld of verwijderd. Iedere laag in het IKM-model is gekoppeld aan de andere lagen en is in staat om de andere lagen direct of indirect te beïnvloeden.

Het model kent drie dynamische grootheden: klanten, instellingen en maatschappij. De instelling moet zich ervoor hoeden om als een hindernis tussen de klanten en de maatschappij te staan. Haar bestaansreden ligt in de vooronderstelling dat het meer teruggeeft aan de klanten dan dat het onttrekt aan de maatschappij. Om dit waar te kunnen maken, moet iedere laag in de instelling worden ontworpen en gerealiseerd in het kader van een IKM-model. Hieronder worden de diverse lagen in het IKM-model binnen de instelling nader beschreven, met speciale nadruk op de metadata en het Historisch Data Warehouse.

De producten en diensten tonen de meerwaarde van de instelling aan de klanten. Deze producten en diensten kunnen zeer gevarieerd zijn, bijvoorbeeld publicaties, tentoonstellingen, toegangen, merchandising en raadpleegmogelijkheden van origineel of gereproduceerd materiaal in een studiezaal. Uiteraard is een website ook een product omdat het een digitaal platform creëert voor allerlei diensten. Nieuwe, gewijzigde en verwijderde producten en diensten zullen altijd veranderingen veroorzaken in andere lagen binnen de organisatie.

Alle producten en diensten worden gemaakt en onderhouden door de werkprocessen binnen de instelling. Deze werkprocessen omvatten alle activiteiten die meerwaarde geven aan de producten. Deze activiteiten zijn altijd onderling van elkaar afhankelijk. Traditionele werkprocessen binnen instellingen voor cultureel erfgoed zijn verwerving, toegankelijk maken, beheer en dienstverlening. Als een nieuw product wordt gemaakt voor de klant, bijvoorbeeld een virtuele tentoonstelling op Internet, dan zal dat invloed hebben op de dienstverlening en de benodigde metadata. Het werkproces toegankelijk maken kan ook beïnvloed worden. Zelfs is het mogelijk dat nieuw materiaal verworven moet worden om het product te kunnen realiseren.

Voor de realisatie van producten en diensten is altijd een correcte en volledige verzameling van metadata nodig. Er bestaat veel verwarring over de definitie van de term metadata binnen verschillende disciplines. Naar mijn mening omvat het begrip metadata voor instellingen voor cultureel erfgoed gestructureerde gegevens over het historische materiaal dat wordt bewaard in een instelling (bijvoorbeeld overzichten, catalogi, inventarissen en genealogische indexen), ongestructureerde gegevens over dat materiaal (bijvoorbeeld publicaties en handleidingen) en kennis die bij de medewerkers van de instelling aanwezig is over dat materiaal. De laatste categorie kunnen ook omschreven worden als mobiele metadata, met alle risico’s van dien (ziekte, pensioen, vakantie etc.).

De juistheid en volledigheid van de metadata worden bepaald door de manier waarop de medewerkers informatie samenstellen binnen een bepaald werkproces. Des te meer de metadata zijn gestructureerd, gestandaardiseerd en bewaard in goede en open databases, des te beter kunnen zij de diverse werkprocessen ondersteunen. Teneinde een degelijke verzameling aan metadata te kunnen samenstellen en onderhouden, is een actief IKM-beleid noodzakelijk. Het IKM-beleid dient er zorg voor te dragen dat zoveel mogelijk gegevens beschikbaar zijn op de momenten en plaatsen dat ze voor een werkproces nodig zijn.

Het is van belang om een goed onderscheid te maken tussen metadata die gestructureerd kunnen worden en metadata die ongestructureerd blijven. Om dat duidelijk te maken is de volgende weergave van de cyclus van kennis behulpzaam [3].

diagram 2
Diagram 2

In dit diagram zijn de gegevens de meest gestructureerde metadata. De gegevens worden als feiten gezien en als zodanig beschreven. Moderne ICT-concepten en –technologieën zijn zeer behulpzaam in het dusdanig bewaren en onderhouden van die gegevens dat ze op allerlei mogelijke manieren kunnen worden gebruikt. Informatie kan worden gezien als een combinatie van de gegevens voor een specifiek doel. Juiste informatie leidt tot kennis. Deze kennis vergroot het inzicht over een onderwerp. Dit inzicht kan weer leiden tot nieuwe gegevens of wijzigingen van bestaande gegevens.

In de praktijk is het onmogelijk om alle kennis uit mensen te halen teneinde een complete verzameling aan gegevens over ieder relevant onderwerp samen te stellen. Aangezien de mens gegevens en informatie aan elkaar kan koppelen op een manier die door geen enkel informatiesysteem kan worden gevenaard, is het voor het IKM-beleid een grote uitdaging om zoveel mogelijk gegevens en informatie vast te leggen op een gestructureerde manier, zodat zij eenvoudig en onafhankelijk van menselijke tussenkomst kunnen worden gebruikt.

Voor gestructureerde metadata is het mogelijk om criteria te bepalen op basis waarvan een gezonde ICT-architectuur kan worden gerealiseerd. Deze criteria kunnen per organisatie verschillen maar de volgende kunnen als universeel worden aangemerkt:

Metadata kunnen worden verdeeld in categorieën op grond van hun betekenis en van het werkproces waarin ze worden gecreëerd en onderhouden. Mogelijke categorieën voor metadata van instellingen van cultureel erfgoed zijn:

Verschillende internationale standaarden, zoals Dublin Core, ISAD(G), ISAAR(CPF) and EAD, bevatten veel of alle hierboven vermelde categorieën. Ze bevatten echter niet alle mogelijkheden om de categorieën te koppelen aan aggregatieniveaus en context van de metadata.

Bij instellingen die historisch materiaal bewaren, dienen alle producten, werkprocessen en metadata een relatie te hebben met dat materiaal. Het behouden van dat materiaal is op de lange termijn de belangrijkste taak van de instelling. In het IKM-model heb ik dat materiaal op een eigentijdse manier omschreven als een Historisch Data Warehouse. De reden is dat in veel literatuur over ICT metadata worden gekoppeld aan een Data Warehouse. Historische archieven en collecties hebben vaak dezelfde functie als een Data Warehouse in een moderne organisatie. Ze vormen de basis voor het verschaffen van accurate en onveranderbare informatie teneinde besluitvorming, kennis en inzicht te ondersteunen.

Marco geeft de volgende bruikbare definitie van een Data Warehouse: “A data warehouse is a single, entreprise-wide collection of data”. Deze verzameling dient te voldoen aan de volgende vier randvoorwaarden:

  1. Een Data Warehouse is onderwerpsgericht;

  2. Een Data Warehouse geeft een integraal beeld van de werkgebieden van een organisatie;

  3. De gegevens in een Data Warehouse zijn onveranderbaar;

  4. Een Data Warehouse bevat historische gegevensverzamelingen [5].

Het concept Data Warehouse is ontwikkeld binnen de ICT-wereld voor gegevens die digitaal worden bewaard. Hoewel dat niet opgaat voor de meerderheid van gegevens die worden bewaard in organisaties voor cultureel erfgoed, is de vergelijking erg bruikbaar.De bovengenoemde uitgangspunten voor een Data Warehouse gaan ook op voor archieven en collecties, ook al zijn die niet samengesteld op een digitaal platform. De vergelijking kan dienen om een kloof te dichten tussen twee werelden die al te zeer van elkaar gescheiden zijn.

Een ander voordeel voor het aanduiden van archieven en collecties als een Historisch Data Warehouse voor de maatschappij is dat het begrip metadata op zijn plaats valt. Het begrip metadata wordt vaak gebruikt voor het aanduiden van de gegevens die nodig zijn voor het onderhouden van een Data Warehouse. Metadata zijn de gegevens die worden samengesteld, gewijzigd en verwijderd in de werkprocessen, de gegevens in een Data Warehouse mogen nooit worden gewijzigd. David Marco beschrijft de concepten van metadata en Data Warehousing op een erg herkenbare manier: “Meta data is the card catalog in a data warehouse. By defining the contents of a data warehouse, meta data helps users locate relevant information for analysis. In addition, meta data enables users to trace data from the data warehouse to its operational source (i.e. drill-down) and to related data in other subject areas (i.e., drill-across). By managing the structure of the data over a broad spectrum of time, it provides a context for interpreting the meaning of information” [6].

De vergelijking van historische archieven en collecties met het moderne concept van Data Warehousing is een interessant perspectief voor het ontwikkelen van een eigentijds IKM-model voor instellingen voor cultureel erfgoed. Archiefspecialisten werden overigens niet betrokken bij de ontwikkeling van het concept van Data Warehousing. Dat is tegelijkertijd verrassend en betreurenswaardig omdat ICT-specialisten veel hadden kunnen leren over concepten als authenticiteit, betrouwbaarheid, leesbaarheid en context en creatie van gegevens!

Informatie- en Kennis Management en ICT-architecturen

Het hierboven beschreven IKM-model biedt een abstract, integraal en consistent perspectief op het omgaan met historische gegevens en informatie binnen een organisatie. Het is het zenuwstelsel van de organisatie. Het functioneren van dat zenuwstelsel is tegenwoordig grotendeels bepaald door een goed gebruik van ICT-systemen.

In de laatste decennia zijn een aantal veranderingen opgetreden in het gebruik van ICT-middelen. Overal is ICT begonnen door enthousiaste specialisten die veelal onafhankelijk van elkaar werkten. Deze fase had vaak een experimenteel karakter. Met de groei van het belang en de mogelijkheden van ICT werd het vakgebied een zaak van strategisch belang. Grote monolithische systemen werden gerealiseerd. Met het ontstaan van client-server systemen en vooral met de opkomst van Internet werden systemen ontwikkeld die middels een integraal concept werden ontwikkeld Dit concept wordt doorgaans ICT-architectuur genoemd. De snelheid waarin deze ontwikkeling plaats heeft gevonden is erg verschillend. In instellingen voor cultureel erfgoed komen de beschreven fases vaak tegelijkertijd voor.

Wat is een ICT-architectuur? Applegate beschrijft het als volgt: “Just as the blueprint of a building’s architecture indicates not only the structure’s design but how everything –from plumbing and heating systems to the flow of traffic within the building- fits and works together, the blueprint of a firm’s information architecture defines the technical computing, information management, and communications platform. The IT Architecture provides an overall picture of the range of technical options available to a firm, and, as such, it also implies the range of business options. Decisions made in building the technical IT architecture must be closely linked to decisions made in designing the IT organization that will manage the architecture, which, in turn, must be linked to the strategy and organization design of the firm itself. Conversely, the organization strategy, structure, incentives, and processes strongly influence how the technology will be designed, deployed, and used within a firm” [7].

Indien het IKM-model zoals dat hier is beschreven als uitgangspunt wordt genomen, dient de inzet van ICT-middelen in iedere laag correct te worden ontwerpen, geïmplementeerd en aan elkaar gekoppeld. In iedere laag zal ICT een rol spelen. Op het gebied van producten en diensten kan gedacht worden aan Internet-applicaties, e-commerce en software om het gedrag van de klant te kunnen vastleggen. Alle werkprocessen zullen een of meer applicaties moeten gebruiken om metadata te raadplegen, in te voeren, te wijzigen of te verwijderen. De metadata, mits digitaal opgeslagen en onderhouden, zullen worden bewaard in databases en tekstbestanden. Het Historisch Data Warehouse zal digitaal historisch materiaal bevatten en digitale reproducties (of zelfs substituten) van origineel, niet-digitaal materiaal bevatten.

Een goede ICT-architectuur zal een antwoord moeten geven op de vraag hoe verschillende componenten worden aangewend in de verschillende lagen in het IKM-model. Er zijn verschillende manieren waarop ICT-componenten worden onderscheiden. Een goed onderscheid wordt gemaakt in onderstaand diagram.

diagram 3
Diagram 3

Net als in het IKM-model zijn alle componenten met elkaar verbonden. In ieder deel moet een verantwoorde keuze worden gemaakt uit de beschikbare producten op de markt. Die keuzes hangen af van het doel, het budget en de structuur van de organisatie.

Een goede manier om deze keuzes te maken, is het uitvoeren van een informatie audit en het ontwikkelen van een ICT-beleid op grond van die audit. Het resultaat van die audit verschilt uiteraard per organisatie. Hieronder beschrijf ik enige conclusies die ik uit mijn huidige praktijk heb getrokken.

Het is van groot belang om moderne hulpmiddelen te gebruiken voor gegevensstructuren. De metadata nemen binnen het IKM-model een sleutelpositie in met betrekking tot het leveren van nuttige en juiste informatie. De belangrijkste randvoorwaarde daarbij is connectiviteit van die gegevens, hetgeen kan worden waargemaakt door het gebruiken van relationele databases. Zij vormen het belangrijkste en krachtige instrument om gegevensstructuren en de gegevens te ontwerpen, te implementeren en te waarborgen. De taal om gegevens in een relationele database te manipuleren, SQL, is wereldwijd geaccepteerd en ondersteund. Relationele databases zijn open, hetgeen inhoudt dat zij direct altijd kunnen worden gekoppeld aan andere databases. Uiteraard dienen de logische en technische structuren op een professionele manier te worden ontworpen en gerealiseerd.

Standaardisatie van metadata is een belangrijk maar vaak verkeerd begrepen aspect. Voor degenen die vaak internationale standaarden hanteren is het wellicht niet nieuw maar veel instituten gebruiken deze standaarden niet. Een van de merkwaardige zaken is dat standaarden als ISAD(G) vaak worden gezien als iets totaal nieuws, terwijl ze meestal een verbeterde versie zijn van eerdere conventies. Het is niet nodig om een volledig nieuwe verzameling van metadata samen te stellen. Vaak is een conversie van de oude naar de nieuwe structuur (en eventueel van verouderde naar moderne, digitale informatiedrager) voldoende. Een ander misverstand met betrekking tot standaarden betreft de vraag wanneer en hoe ze moeten worden geïmplementeerd. Standaardisatie is nodig om een gezamenlijke structuur te creëren om informatie-uitwisseling nodig te maken. Het is in feite niet van belang of een database exact gestructureerd is volgens een standaard. Zolang het mogelijk is om de gegevens te genereren in een gestandaardiseerd formaat, is er geen reden tot zorg. Het is veel belangrijker om ervoor te zorgen dat een state-of-the-art database platform wordt gebruikt die het mogelijk maakt om goed te anticiperen op toekomstige ontwikkelingen in databasetechnologie en standaarden voor metadata.

Een van de fundamentele uitgangspunten in de ICT-architectuur is dat het onderhoud van metadata andere applicaties vergt dan de presentatie van de metadata. Metadata mogen nooit redundant worden samengesteld. Ze moeten worden bewaard in bij voorkeur één database. Ze kunnen echter wel gepresenteerd worden op veel verschillende manieren, bijvoorbeeld middels een zoekmachine op Internet, een geprinte versie en via een website waarin ze worden samengevoegd met gegevens van andere instituten. Daarbij komt dat software voor presentatie van de metadata meestal sneller en vaker moet wijzigen dan software voor onderhoud van die gegevens. Een ICT-architectuur die een goede scheiding maakt tussen deze twee soorten applicaties kan er uitzien zoals in onderstaand diagram. Het biedt een kader voor het ontwikkelen van goede, doelgerichte applicaties.

diagram 4
Diagram 4

Slotopmerkingen: wat is het nut van IKM in de praktijk?

De hierboven beschreven modellen en concepten zijn volstrekt nutteloos als ze niet leiden tot een verbetering van de prestaties van een instelling. Het bewijs van die verbetering kan alleen geleverd worden door een verhoging van de kwaliteit van producten en diensten van de instelling. Een grote meerwaarde van het gebruik van dergelijke modellen ontstaat als ze gebruikt worden bij de definitie van nieuwe projecten en de invloed van de beoogde projectresultaten op de organisatie. Ze kunnen ook nuttig zijn bij het in kaart brengen van de samenhang tussen verschillende projecten. De modellen kunnen worden gebruikt om voor alle werkprocessen duidelijk te maken wat de consequenties zijn als bijvoorbeeld een nieuwe virtuele tentoonstelling op het Internet wordt gemaakt of als een nieuwe zoekmachine voor metadata over archieven en collecties wordt gerealiseerd. Ze kunnen een bijdrage leveren aan het verminderen van het risico dat werkprocessen of metadata dusdanig worden veranderd dat zij niet meer aansluiten bij de behoefte van andere werkprocessen. De modellen kunnen ook gebruikt worden om te voorkomen dat nieuwe informatiesystemen in gebruik worden genomen die de organisatie zullen verhinderen om doelen als integratie, standaardisatie en presentatie te bereiken.

Een IKM-model en een ICT-architectuur bieden zeer effectieve kaders om projecten en werkprocessen te beheersen. Ieder werkproces kan aan elkaar worden gekoppeld. Het wordt mogelijk om bijvoorbeeld een checklist te maken voor nieuwe projecten, om te waarborgen dat zij passen in de uitgangspunten van de organisatie met betrekking tot IKM en ICT.

De belangrijkste vooronderstelling is dat het management van de instelling zich bewust is van het nut van het gebruik van deze instrumenten om de kwaliteit van producten en diensten te verhogen. Dit bewustzijn waarborgt dan tegelijkertijd dat die producten en diensten worden ondersteund door werkprocessen die een duidelijke samenhang vertonen. Het is de verantwoordelijkheid van het management om een beleid te ontwikkelen en uit te voeren op de middellange en lange termijn. De gestelde doelen kunnen dan op dusdanige wijze worden geformuleerd en gerealiseerd dat projecten kunnen worden geïnitieerd die consistent zijn met dat beleid.

Aan het slot van dit artikel geef ik een voorbeeld van het Gemeentearchief Amsterdam met betrekking tot het creëren van nieuwe producten en diensten. Het doel op de lange termijn is de beschikbaarstelling van alle beschikbare beschrijvingen van inhoud en context over de archieven en collecties middels één zoekingang op Internet. Deze zoekmachine dient dusdanig te zijn ontworpen dat de meest gestelde vragen van klanten (vragen over een persoon of instelling, over een onderwerp, een locatie of een periode) zo eenvoudig mogelijk kunnen worden beantwoord. Dit is een zeer omvangrijke taak waarin alle werkprocessen moeten worden betrokken.

Het startpunt verschilt zeer van de gewenste situatie, hetgeen een lot is dat door veel instituten wordt gedeeld. Veel metadata zijn niet compleet, niet gestandaardiseerd, niet digitaal beschikbaar in moderne databases en niet aan elkaar gekoppeld. Het Gemeentearchief Amsterdam heeft niet alleen archieven maar bewaart ook grote collectives bibliotheekmateriaal, audiovisueel; materiaal, foto’s, tekeningen en karotgrafisch materiaal. Het realiseren van de integratie van de metadata over dit materiaal met behulp van de juiste standaarden, is een grote uitdaging. Niet alle werkprocessen zijn dusdanig gestructureerd dat geïntegreerde diensten kunnen worden geboden. Teneinde de vereiste metadata te verkrijgen is een aantal projecten geformuleerd. Het eerste project betrof de realisatie van een volledige gegevensverzameling op het hoogste aggregatieniveau in de vorm van een overzicht. Dit overzicht is inmiddels beschikbaar op Internet [8]. Andere zoekmachines op de website zijn nog niet gekoppeld aan dat overzicht. De volgende stap betreft het presenteren van metadata over archieven op lagere aggregatieniveaus. Deze gegevens waren niet beschikbaar in een database. Daarom is een groot data-entry project uitgevoerd. Het resultaat is een database met 350.000 records. Teneinde deze gegevens als een geïntegreerde service aan te kunnen bieden, is het nodig om ze aan te vullen met zoekingangen op namen van personen, organisaties, onderwerpen, locaties en periodes. Dit project kent een tweelingbroer in het backoffice, waar bestaande informatiesystemen dienen te worden gewijzigd of vervangen om de vereiste metadata op een gestandaardiseerde wijze te kunnen samen te stellen en te onderhouden.

In de komende jaren zullen de metadata over context en inhoud van de archieven en collecties worden geïntegreerd in één model. Het gevolg daarvan is dat vrijwel alle bestaande ICT-systemen moeten worden hergewaardeerd, strategische keuzes moeten worden gemaakt over de keuze van standaarden, veel gegevens geconverteerd moeten worden, kwaliteitscontroles plaats moeten vinden en andere werkwijzen moeten worden ingevoerd. Dit alles kan niet succesvol verlopen zonder het hebben en het uitvoeren van een passend IKM-model en een daarop afgestemde ICT-architectuur.

Een Engelse versie van dit artikel is ook verkrijbaar.

Referenties

  1. Mijn speciale dank gaat uit naar Kent Haworth, York University Archivist and Head, Special Collections en Project Director and Secretary, ICA Committee on Descriptive Standards, voor zijn commentaar op een eerdere versie van dit artikel.
  2. In de meeste literatuur wordt de afkorting “IT” gebruikt, mijn voorkeur gaat echter uit naar de afkorting “ICT”.
  3. Wurman, p. 27 en Milner, p. 3. Ik heb het begrip “wijsheid” in dit diagram vervangen door het meer bescheiden “inzicht”.
  4. Vergelijk bijvoorbeeld Gilliland-Swetland, Anne J, Defining metadata, in Baca, p. 3;
  5. Marco, p. 23-24. Marco citeert Inmon, W.H.: Building the Data Warehouse, Wiley, 1996, p. 33;
  6. Marco, p. 48
  7. Applegate c.s., p. 139-140
  8. < http://www.gemeentearchief.amsterdam.nl/archieven_en_collecties/overzicht/introductie/index.nl.html> Link to external resource

Literatuur

  1. Applegate, Lynda, F. Warren MacFarlan en James L. MacKenney (1999). Corporate Systems Information Management. Irwin MacGraw-Hill, Boston.
  2. Baca, Martha and others. (1998) Introduction to metadata, pathways to digital information. Getty Information Institute, New York.
  3. Cook, Terry (2001). Archival Science and Postmodernism: New formulations for Old Concepts, in Archival Science (2001-1), ed. Horsman, P., E. Ketelaar and T. Thomassen, Kluwer Academic Publishers, Dordrecht, p. 3-24.
  4. Getty Information Institute, New York, Art and Architecture Thesaurus
    URL: <http://www.getty.edu/research/tools/vocabulary/aat> Link to external resource
  5. International Council of Archives (ICA), ISAAR(CPF) standard
    URL: <http://www.ica.org> Link to external resource
  6. International Council of Archives (ICA), ISAD(G) standard
    URL: <http://www.ica.org> Link to external resource
  7. Marco, David (2000). Building and managing the meta data repository, a full life-cycleguide. John Wiley & Sons, New York.
  8. Menne-Haritz, A. (2001). Access: the reformulation of an archival paradigma, in Archival Science (2001-1), ed. Horsman, P., E. Ketelaar and T. Thomassen, Kluwer Academic Publishers, Dordrecht, p. 57-82.
  9. Milner, Eileen M. (2000). Managing Information and Knowledge in the Public Sector. Routledge, London.
  10. Records Continuum Research Group, Australia.
    URL: <http://rcrg.dstc.edu.au> Link to external resource
  11. Ribeiro, Christina and Gabriel David (2001). A Metadata Model for Multimedia Databases.
  12. Smit, F.P. (2000). Proposal for a Datamodel of Archival Descriptions, in: Atti del Summit DACE, Roma, 2000, p. 149-196.
  13. Smit, F.P. (2001), Het nieuwe Overzicht van Archieven en Collecties, in: Archievenblad (2001-1), Koninklijke Vereniging van Archivarissen, Amsterdam, p. 26-29.
  14. Society of American Archivists, Encoded Archival Description
    URL: <http://www.loc.gov/ead> Link to external resource
  15. Svenonius, Elaine (2001). The Intellectual Foundation of Information Organization. The MIT Press, Cambridge Massachusetts.
  16. Wurman, Richard Saul (2001). Information Anxiety 2. QUE, Indianapolis.

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Author Details

Frans SmitFrans Smit
Hoofd van de Sectie Ontsluiting
Gemeentearchief Amsterdam
PO Box 51140
1007 EC Amsterdam
The Netherlands

Phone: ++31 20 5720227
Fax: +31 20 6750596

<fsmit@gaaweb.nl> Link to an email address
<franssmit@planet.nl> Link to an email address
<http://www.gemeentearchief.amsterdam.nl> Link to external resource

Frans Smit is hoofd van de Sectie Ontsluiting van het Gemeentearchief Amsterdam. Hij is (en was) betrokken bij diverse nationale en internationale projecten met betrekking tot het verschaffen van toegang tot metadata over archieven en collecties door middel van zoekmachines op Internet.

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

For citation purposes:
Smit, F. "Het Historisch Data Warehouse", Cultivate Interactive, issue 6, 11 February 2002
URL: <http://www.cultivate-int.org/issue6/warehouse-d/>