XML
Uit UitgeefWiki
Crossmediaal uitgeven vraagt om een slimme opslag van content. Hergebruik en publicatie op verschillende platformen staan bij crossmedia centraal. Voor uitgevers is er maar één echte standaard om content toekomstgericht op te slaan: XML. XML verbindt bovendien content van verschillende platformen met elkaar en vormt daarmee de lijm in bijvoorbeeld web 2.0 omgevingen.
Wat is XMLXML staat voor Extended Markup Language en is een broertje van HTML dat staat voor HyperText Markup Language. XML wordt gebruikt om gegevens te beschrijven, HTML om vormgegeven webpagina’s te maken. HTML heeft als nadeel dat de content, bijvoorbeeld tekst, gemixed is met de vormgeving. Het is dan ook erg lastig om tekst uit een opgemaakte webpagina te isoleren. Nog lastiger is het om de opbouw van de tekst terug te herleiden uit een webpagina. Wat de kop, het intro en de auteursnaam is, is bijna niet automatisch uit een opgemaakte webpagina te halen. De enige manier om dat moeizame proces te automatiseren is het herkennen van fonts en fontgroottes om op die manier tekstonderdelen te herkennen. Het zelfde nadeel heeft een pdf-document. Ook al is dat document leesbaar op bijna alle platformen, het is bijna ondoenlijk om een opgemaakt pdf-document te ontleden in verschillende onderdelen. Wie content wil hergebruiken of op een ander platform wil publiceren, kiest dus niet voor het html- of pdf-formaat. In Quark Xpress en Adobe Indesign documenten worden tekst en beeld beter van elkaar gescheiden, maar ook deze documentformaten zijn niet ideaal om content later te hergebruiken. Bron bewarenHet lijkt misschien logisch om de brondocumenten te bewaren naast de opgemaakte documenten. Dat is zeker logisch, maar ook dat heeft nadelen. De meeste teksten worden bijvoorbeeld gemaakt in Microsoft Word. Vandaag de dag kan iedereen deze documenten lezen en het doc-formaat lijkt daarmee een heuse standaard. Maar een kleine twintig jaar geleden was WordPerfect 4.2 de standaard en weet u zeker dat u die documenten vandaag nog kunt lezen? Verder gebruikt lang niet iedereen Word. Steeds meer overheden schakelen bijvoorbeeld over op het besturingssysteem Linux en gebruiken OpenOffice als tekstverwerker. Ook de Mac wordt steeds populairder en daarop tekstverwerken een hoop mensen met Apple’s iWork. Nu zijn al die ‘alternatieve tekstverwerkers’ wel op de een of andere manier compatibel met Word, maar een echte standaard is het niet. Bovendien komt er bij het tekstverwerken nog een probleem kijken. Misschien wilt u bepaalde woorden opnemen in een index. Alle tekstverwerkers hebben wel een mogelijkheid om die woorden te markeren, maar een echte standaard is er niet. Hoe geeft u aan dat u woorden in de tekst wilt benadrukken? Maakt u die woorden vet of zet u die cursief in de tekst? In gedrukte tekst is cursief goed leesbaar, maar op een webpagina zijn cursieve tekstgedeelten een stuk minder leesbaar. Beter is het dus om die gedeelten te markeren met de stijl ‘benadrukken’. Pas later, afhankelijk van de publicatievorm, kiest u hoe de stijl ‘benadrukken’ er in de vormgeving uit gaat zien. Voordelen XMLHergebruik is de belangrijkste reden om content op te slaan in het XML-formaat. Bovendien is het een formaat waarmee steeds meer programma’s overweg kunnen. Word en Indesign lezen XML en het databaseprogramma FileMaker Pro leest en schrijft ook gegevens in XML. Web 2.0 websites gebruiken XML om functionaliteit van andere websites aan te roepen. De Google Maps routebeschrijving bijvoorbeeld die veel bedrijven op hun website hebben, wordt aangeroepen met een paar regels XML waarin onder andere de coördinaten van het bedrijf zijn opgenomen. XML wordt ook gebruikt voor rss-feeds. Kenmerken van XML
Voorbeeld van een XML-document<contactpersoon> <persoon> <voornaam>Huub</voornaam> <tussenvoegsel>van de</tussenvoegsel> <achternaam>Pol</achternaam> </persoon> <persoon> <voornaam>Ferdinand</voornaam> <achternaam>Sennema</achternaam> </persoon> </contactpersoon> MogelijkhedenHet werken met XML heeft nog een aantal voordelen. Er is een mechanisme om gegevens te valideren, bijvoorbeeld bij de invoer ervan. Dat is ideaal om bijvoorbeeld een taxonomie af te dwingen. Een goed vastgelegde taxonomie voorkomt dat er verschillende benamingen voor hetzelfde worden gehanteerd, zoals bij bijvoorbeeld de benamingen ‘auteur’ en ‘schrijver’. Dat valideren van XML-gegevens gaat met een Document Type Definition (DTD) of XML Schema. Omdat gegevens zo gestructureerd zijn opslagen in XML, is het vaak ook mogelijk om die gegevens automatisch op te maken. Boeken zijn bij uitstek geschikt om automatisch op te maken, maar ook eenvoudige tijdschriften, complexe catalogi, folders, losbladige uitgaven en handleidingen lenen zich goed voor automatisch opmaak. XML bewijst bovendien zijn kracht wanneer bijvoorbeeld een catalogus in meerdere talen verschijnt. De tekst varieert, maar de opmaak blijft hetzelfde. Met een op XML gebaseerde automatische opmaakstraat rolt een catalogus vanuit de database zo van de drukpers. Zie ook Van XML naar uitgeefproduct |
