#7 Mashups voor archieven
De kern van mash-ups is open data. Als je de data beschikbaar stelt op een goed beschreven manier, kunnen anderen daar leuke dingen mee doen. Volgens mij is daar voor archieven nog een wereld te winnen.
Genlias monitor
Een voorbeeld van een dienst die op een mashup lijkt, is de Genlias monitor die door Bob Coret is ontwikkeld. Stamboomonderzoekers kunnen zich via de monitor abonneren op nieuwe aktes die in Genlias worden opgenomen.
Maar Genlias stelt zijn data niet op een open manier beschikbaar. Bob Coret heeft dus door veel hoepels moeten springen om de informatie van de Genlias-site te schrapen. Als Genlias wordt aangepast, werkt de monitor niet meer.
Gewenste situatie
In een ideale wereld zouden databases zoals Genlias open worden gesteld. Er is dan een API (Application Programmer Interface) beschikbaar waarmee programmeurs op een gestandaardiseerde manier de gegevens kunnen benaderen.
Bob Coret is niet de enige. Er zijn veel gebruikers van onze collecties die niet alleen enthousiast zijn over hun hobby/werk maar die ook technisch onderlegd zijn. Ik pleit dan ook voor het openstellen van onze data, zodat onze bezoekers ons kunnen verrassen met alle applicaties die ze ontwikkelen.
Voordelen van open data
- Meer innovatie doordat andere partijen ook producten kunnen ontwikkelen op basis van de data
- Betere inzet van middelen van de archieven doordat een deel van de productontwikkeling aan de markt overgelaten kan worden.
- Gemakkelijker samenwerken met andere instellingen, bijvoorbeeld bij het ontwikkelen van portalsites die data van meerdere instellingen doorzoeken
- Meer gebruik van de collecties.
Reacties?
Wat vinden jullie? Moeten we onze data openstellen of moeten we vooral onze monopoliepositie op de data blijven handhaven?
Met openstellen van data wordt de data en gebruik verrijkt!
In december 2006 schreef ik hier ook over in Na toegankelijke websites ook toegankelijke data! (maar met een centrale basisregistratie voor genealogie sloeg ik denk ik wat door!)
Via http://api.coret.org/ probeer ik een goed voorbeeld te geven.
Alhoewel ik van harte hoop dat opvolger MijnVoorouders/WieWasWie een API gaat bieden, verwacht ik toch minimaal RSS feeds!
mvg,
Bob Coret
Ik weet niet veel van de onderliggende architectuur van MijnVoorouders/WieWasWie maar deel je wens dat daar een API bijhoort. Zo'n rijke bron is ook voer voor onderzoekers en informatici. Bijv. het bedenken van een algoritme om te bepalen of twee vermeldingen in verschillende aktes over dezelfde persoon gaan. Als je dat een keer hebt kun je automatisch kwartierstaten genereren. Hebben we eindelijk wat zoveel bezoekers denken dat al lang kan met Genlias: "Op welke knop moet ik drukken voor mijn voorouders?"
Aan het algoritme wordt al gewerkt: Genlias doorspitten om automatisch verbanden te leggen tussen voorouders (hoop binnenkort met Mandemakers kennis te maken).
Ik had zoiets gehoord, maar wist niet dat het al zo concreet was. Bedankt voor de link!
Yvette, ik ben hartstikke vóór. Neemt niet weg, dat ik tegelijkertijd een trend zie waarin steeds meer archiefdiensten delen van hun data - meestal de scans - achter een 'decoder' stoppen. Soms een eigen keuze, soms ingegeven door een opdrachtgever, die met een zogezegd verdienmodel iets terug wil zien van zijn investering (en dan iets anders dan verrijkte data, mooie applicaties enzovoort... dus gewoon geld).
Maar los van die scans zou het al heel mooi zijn als we minimaal de databases allemaal open kunnen zetten. Ik streef daar in ieder geval naar! :-)
Zal ik de deur nog wat verder open zetten?
Open die handel.
Het blijft toch mijn droom dat de data weer terugkomt in de handen van de rechtmatige eigenaar: de gebruiker / onderzoeker / klant / burger.
Inderdaad, laat die er lekker mee stoeien, leuke dingen mee doen. Ik ben er van overtuigd dat we daar meer voor terugkrijgen dan het geld dat we met de verkoop van welke informatie dan ook kunnen verdienen.
Ik kan er nog veel meer over zeggen, maar doe dat lekker niet.
Laten we samenwerken om de data open te krijgen en te houden.
Ik ga er in ieder geval mijn best voor doen.
@Yvette en @Bob
Dat geautomatiseer van de stamboom... Laat het aan de mensen over! Wat is nou leuker dan zelf de ontdekkingen doen en de links leggen in de database.
Open en makkelijk.
Als je dat gaat automatiseren, gaat dat hier en daar mis en krijg je nog meer vervormde genealogische constructies.
Dat is een leuke exercitie voor statistici en dat moeten ze ook zeker gaan doen. Daar kun je met een foutenmarge wegkomen. In je stamboom is dat toch minder prettig... :-)
Och, fouten zijn een essentieel onderdeel van de genealogie. Ik durf te wedden dat ik tenminste 1 voormoeder had die zelf niet eens wie de vader van het kind was. Hoe kunnen wij eeuwen later dan met zekerheid achterhalen wie het was? :-)
Verder ben ik het er helemaal mee eens dat we de data gratis op een open manier ter beschikking moeten stellen. Door alle nieuwe toepassingen die dan zullen ontstaan maak je dit deel van het cultureel erfgoed pas echt laagdrempelig toegankelijk!
En hoeveel valt er nou mee te verdienen? Dan moet je wel een supergoed product neerzetten.
Als je niet oppast ga je taken doen die ook door marktpartijen gedaan kunnen worden (zoals Ancestry of Familysearch in het buitenland) en voor je het weet word je geprivatiseerd! Schoenmaker blijf bij je leest :-)
Voor wie enige uitleg behoeft over het begrip API, verscheen er op Frankwatching een lezenswaardig artikel, geillustreerd met voorbeelden.
Prachtige initiatieven, waar de bibliotheekwereld wel eens voorbeeld aan mag nemen.