Wikipedia:GLAM/Koninklijke Bibliotheek en Nationaal Archief/Data/OpenDataKB/SGD
Nieuws | Over onze samenwerking met Wikimedia | Projecten | Evenementen & bijeenkomsten | KPIs | Archief (2013-2014) | Alle pagina's |
Staten-Generaal Digitaal (open dataset)[bewerken | brontekst bewerken]
Full-text Kamerverslagen, Kamerstukken en Kamervragen uit de periode 1814 tot 1995.
Inhoud van de dataset[bewerken | brontekst bewerken]
1) Kamerverslagen (of Handelingen) - Woordelijke verslagen van de vergaderingen van
- de Eerste en de Tweede Kamer
- de Verenigde Vergadering
- de Openbare Commissie Vergaderingen gehouden van 1962 t/m 1980
- de Uitgebreide Commissie Vergaderingen gehouden van 1980 t/m 1994
2) Kamerstukken (of Bijlagen) - Schriftelijk uitgewisselde stukken (inclusief de rijksbegroting) tussen de regering en het parlement.
3) Kamervragen (of Aanhangsels) - Schriftelijke vragen van Eerste en Tweede Kamerleden en de bijbehorende antwoorden van de minister of staatssecretaris.
4) Registers (op personen en zaken) - Lijsten met namen (persoonsregisters) en zaken (zaakregisters) met daarachter verwijzingen waar deze personen en zaken in Kamerverslagen, -stukken of -vragen voorkomen. Een compleet overzicht van registers is hier te vinden. Alleen de persoons- en zaakregisters zijn doorzoekbaar. Zie deze PDF voor achtergrondinformatie over registers en lemma’s.
Daarnaast zijn apart beschikbaar:
- Kaarten: De kaarten (vanaf het zittingsjaar 1863-1864) dienden als visueel beleidsmateriaal bij memories van toelichting, voorlopige verslagen, memories van antwoord, etc. De kaarten zijn voorzien van precieze geografische informatie (lengte en breedte) en apart doorzoekbaar.
- Lemma’s uit de persoons- en zaakregisters.
- Volgorde van sprekers in de Kamerverslagen.
Bestanden[bewerken | brontekst bewerken]
Voor elke van de ongeveer 454.800 Kamerverslagen, Kamerstukken, Kamervragen en registers zijn de volgende bestanden beschikbaar:
1. beschrijvende metadata (Dublin Core)
2. structurele metadata (MPEG21-DIDL)
3. document (PDF)
Daarnaast is er aparte beschrijvende metadata voor:
4. de 1112 kaarten uit de Handelingen (Dublin Core in XML)
Voor elk van de circa 2,5 miljoen gescande pagina’s zijn de volgende bestanden beschikbaar:
5. de afbeelding in hoge resolutie (JPEG)
6. de tekst (OCR in XML)
7. de coördinaten van elk woord op een pagina (ALTO)
Daarnaast zijn er aparte XML-bestanden beschikbaar voor:
8. de lemma’s (38.294 records) uit de persoons- en zaakregisters (Dublin Core in XML)
9. de volgorde van sprekers in de Kamerverslagen (ALTO)
De metadata en digitale objecten in de set beslaan ongeveer 30 TB.
Techniek[bewerken | brontekst bewerken]
Technische uitleg over en voorbeelden van de:
- beschrijvende metadata (Dublin Core),
- structurele metadata (MPEG21-DIDL),
- full text-objecten (PDF, OCR, ALTO, JPEG)
- metadata-harvest-API op basis van OAI-PMH
- zoek-API op basis van SRU
vindt u in de:
- Uitgebreide technische uitleg over de set (PDF)
- Kortere snelstart (PDF)
Praktijk[bewerken | brontekst bewerken]
De set wordt momenteel al gebruikt in:
- Polimedia
- PoliticalMashup (zie Case study - pdf)
- Rechtsorde
Voorwaarden hergebruik & bronvermelding[bewerken | brontekst bewerken]
- De objecten in deze set (PDF, JPEG, OCR, ALTO) zijn beschikbaar onder de CC0 1.0 Universal verklaring.
- De Tweede Kamer der Staten-Generaal en de Koninklijke Bibliotheek hebben afstand gedaan van het auteursrecht op de beschrijvende en structurele metadata. Deze bestanden zijn dus ook beschikbaar onder de CC0 1.0 Universal verklaring.
Het is niet verplicht om aan bron- en naamsvermelding bij gebruik van de set te doen. Dit neemt niet weg dat de KB en de Tweede Kamer dit wel bijzonder op prijs stellen. Gebruik hierbij de volgende formulering:
Tweede Kamer der Staten-Generaal & Koninklijke Bibliotheek, Den Haag. Bron: statengeneraaldigitaal.nl – [link naar object].
Contact & feedback[bewerken | brontekst bewerken]
We zijn zeer benieuwd door wie en hoe de Staten-Generaal Digitaal-data wordt gebruikt. Wij verzoeken u dan ook een mail met uw contactgegevens en een korte uitleg over wat u met de data doet naar dataserviceskb.nl te sturen. Feedback op onze data en API’s is uiteraard ook zeer welkom. Het verstrekken van uw gegevens geeft ons ook de mogelijkheid om u op de hoogte te houden van relevante ontwikkelingen, zoals wijzigingen in de dataset of het vrijkomen van nieuwe datasets.
Zie ook[bewerken | brontekst bewerken]
- Website Staten-Generaal Digitaal
- Extra uitleg over de gebruikte teminologie binnen deze set is te vinden in dit artikel: https://www.politiekcompendium.nl/9351000/1f/j9vvh40co5zodus/vh4vajb0srzg
Deze open dataset is ook op andere sites beschikbaar
- De SGD-set op de 'master'-site van de Koninklijke Bibliotheek: kb.nl/dataservices. De beschrijving is daar het meest up-to-date
- De SGD-set op opencultuurdata.nl
- De SGD-set op Data.overheid.nl
- De SGD-set op Opendatanederland.org
- De SGD-set op Narcis.nl
- Binnenkort komt de SGD-set ook beschikbaar via Publicdata.eu
|}