TheaterEncyclopedie:In reprise
Deze pagina beschrijft het project Integratie In reprise, gericht op de integratie van de informatie van de website inreprise.org met de TheaterEncyclopedie. Het project bevindt zich momenteel (januari 2023) in de voorbereidende fase (zie ook verderop voor de actuele stand van zaken m.b.t. besluitvorming).
Inleiding
In reprise heeft tot doel belangrijke historische Nederlandse toneelstukken opnieuw onder de aandacht brengen. In een samenwerkingsverband tussen onder andere de Universiteit van Amsterdam (Afdeling Theaterwetenschap en de Universiteitsbibliotheek), Universiteit Groningen (afdeling Nederlands) en DW Projecten vof is onder meer de website inreprise.org gerealiseerd. Op deze website, die onder auspiciën staat van de Stichting Digitale Werken, is informatie over de honderd meest van belang geachte toneelstukken bij elkaar gebracht.
De eindredactie van de website is in handen van Marsha Keja en René van Stipriaan.
In 2022 (?) zijn verkennende gesprekken gevoerd tussen In reprise en de TheaterEncyclopdie, om de mogelijkheid tot een vergaande integratie te onderzoeken. Tijdens een vervolgbespreking begin 2023 is besloten om een voorstel in de vorm van een Plan van Aanpak voor deze integratie op te stellen. Een voorstel voor dit plan is hieronder uitgewerkt.
Dit plan is tot stand gekomen is samenwerking met de onderstaande betrokkenen:
Vanuit In Reprise:
- René Stipriaan (In reprise - Digitale Werken)
- Coen van der Geest (In reprise - Digitale Werken)
Vanuit de TheaterEncyclopedie:
- Hans van Keulen (UvA - Allard Pierson, Conservator, TheaterEncyclopedie)
- Milco Feijnenbuik (UvA - Allard Pierson, Eindredacteur TheaterEncyclopedie)
- Bart Mulckhuijse (WikiWerkers, TheaterEncyclopedie)
Doelstelling
Integratie van (de website / informatie van) het project InReprise van DW Projecten in de TheaterEncyclopedie van het Allard Pierson:
- Behoud van de resultaten van het project In Reprise, ook nadat de website inreprise.org eventueel technisch zal zijn beëindigd.
- Toegankelijk maken van de betreffende informatie via de TheaterEncyclopedie van het AllardPierson om zo een eventueel vervolg van In reprise te faciliteren.
Plan van Aanpak
De voorkeur gaat uit naar een aanpak in twee fasen, waarbij als eerste alle data van In reprise binnen het CMS van de TheaterEncyclopedie wordt geconsolideerd, waarmee deze relatief snel is veiliggesteld en binnen de technische omgeving verwerkt kan worden.
Daarna volgt de daadwerkelijke integratie, waarbij de data van In reprise verwerkt (ge”matched”, gekoppeld, toegevoegd, gepresenteerd, …) wordt binnen de hoofdstructuur van de TheaterEncyclopedie. Door de omvang van het bestand aan data binnen In reprise zal de verwerking (door redactie, vrijwilligers etc.) geruime tijd in beslag nemen.
In de onderstaande tekst wordt In reprise verkort tot IR en TheaterEncyclopedie tot TE.
Fase 1: Consolidatie van alle data/informatie
- Doelstelling
- Consolidatie In reprise; het veiligstellen van alle informatie, die nu via Inreprise.org gepubliceerd wordt, zodanig dat deze beschikbaar is voor verdere verwerking/integratie in de TE (of andere projecten).
- Aanpak
- Consolidatie bestaat uit de stappen:
- Het inventariseren/documenteren* van de informatie/data uit IR
- Exporteren van de informatie in standaard formaten uit IR
- Het kopiëren/uploaden/importeren van de informatie naar (de server of het CMS van) de TE
*NB: Documentatie moet (deels) nog gemaakt worden.
Stap 1: Inventariseren en documenteren
Ten behoeve van de integratie zal IR de volgende complete en geactualiseerde documentatie, inventarislijsten en overzichten ter beschikking stellen:
- Informatiemodel gestructureerde data (ontologie; beschrijving van entiteiten/categorieën)
- Inventarisatie en beschrijving media database, toegepaste conventies voor bestandsbenaming (incl. directory paden)
- Inventarisatielijsten/indexen van de diverse categorieën pagina’s (thesaurus)
- In de beschikbare technische exportformaten (CSV, XML, JSON, HTML, ...)
Voor zover van belang dan wel mogelijk wordt de documentatie binnen het CMS van de TE opgeslagen.
Ter afronding van Fase 1 - stap 1 wordt tevens de planning van de vervolgstappen opgesteld en vastgesteld.
Stap2: Exporteren van de informatie uit IR
Exporteren van de data in standaard formaten uit IR:
- Internet pagina’s / content blokken (omzetting van standaard text / html naar Wikitext*)
- Gestructureerde data / DB-tabellen (CSV, XML en/of JSON formaten)
- Mediabestanden (JPG, PDF, …)
Stap3: Importeren van de informatie in de TE
Kopiëren van de data naar de server van de TE:
- Documentatie IR overbrengen naar project-naamruimte (projectdocumentatie) van de TE
- Webpagina’s naar wikipagina’s (naar separate naamruimte binnen de wiki)
- Uploaden van de gestructureerde data (naar in- of externe mediabibliotheek van de TE)
- Uploaden van de mediabestanden (naar in- of externe mediabibliotheek van de TE)
*Conversie naar wikitext kan voor een groot deel met (online) tools, maar vergt handmatig bijwerken. Als alternatief kan gekozen worden voor het gebruik van “raw”-html bijv. met behulp van deze extensie. NB: Deze MediaWiki-extensie is momenteel nog niet geïnstalleerd op de TE.
- Resultaten
- Na succesvolle afronding van de drie stappen zijn de volgende resultaten behaald:
- Teksten webpagina’s zijn gedocumenteerd en beschikbaar op de website de TE
- NB: dit is géén “volledig functionerende kopie” van de content van de huidige website; navigatie ontbreekt, afbeeldingen waarschijnlijk ook en interne koppelingen functioneren niet!
- Gestructureerde informatie is gedocumenteerd en beschikbaar op de website van de TE (bijv. voor importeren in de semantische database)
- Mediabestanden zijn gedocumenteerd en beschikbaar op de website van de TE voor verder gebruik/weergave.
- Optioneel / Extra
- Om concreet een begin te maken met de integratie, is het vrij eenvoudig om snel/deels een aantal onderdelen van IR in de TE over te nemen:
- Begin maken met het overnemen van de tijdbalk uit Inreprise.org in een tijdlijn, zoals beschikbaar en vormgegeven op de TE
- Overnemen van de lijst van 25 in tekstvorm, als basis voor verdere integratiewerkzaamheden
- Overnemen van de lijst van 100 in tekstvorm, als basis voor verdere integratiewerkzaamheden
Fase 2: Integratie en verwerking van informatie
Dit onderdeel van het Plan van Aanpak wordt op een later tijdstip verder ingevuld. Voor de beeldvorming staat hieronder in willekeurige volgorde een opsomming van enkele mogelijke onderdelen:
- Realisatie van Tijdlijn Toneel gebaseerd op de Tijdbalk van IR - Zie bijvoorbeeld Canon van het Theater in Nederland en Tijdlijn Opera
- Overname van de lijsten van de “Top 25” & “Top 100” van toneelwerken in de TE
- Zie bijvoorbeeld Eenlevenlangtheater en Vice Versa (toegankelijk via het portaal Thema's)
- Matchen (linken) van theaterwerken IR en TE, vervolgens zo mogelijk aanvullen dan wel overnemen en aanvullen op TE
- Matchen (linken) van mediabestanden aan:
- Toneelstukken i.c. Werken (TE)
- Producties
- Personen
Besluitvorming
- 19 januari 2023 - Besluit door betrokkenen tot opstellen van een Plan van Aanpak voor de integratie van In reprise
- Vervolg
- Te nemen besluiten
- mei 2023 - Akkoord van Stichting Digitale Werken (??) voor integratie op basis voorstel Plan van Aanpak (informatie + publicatierechten)
- juni 2023 - Besluitvorming over beschikbaarstelling middelen en planning door Milco Feijnenbuik (Eindredactie TE) en Hans van Keulen.
Planning
Voorlopig is eind 2023 als eindpunt van het project gewenst.