Traduir arxius de llenguatge de marques: HTML, XML, XLIFF

Ampersand

Què és el llenguatge de marques?

El llenguatge de marques (markup language en anglès) és un sistema de codificar un document combinant text i etiquetes o marques que contenen informació addicional sobre l’estructura del text i la seva presentació.

La idea i el nom van sorgir de les anotacions que els editors escrivien als manuscrits amb instruccions de revisió i maquetació del document per a la impremta. De la mateixa manera, aquest concepte es va traslladar mitjançant el llenguatge de marques al món de la informàtica.

Tipus principals de llenguatge de marques per a la traducció

html, etiquetes, tags, llenguatge de marquesEl llenguatge de marques més estès i conegut és l’HTML (HyperText Markup Language, llenguatge de marques d’hipertext) i és la base de la World Wide Web, ja que es fa servir per indicar a un navegador de quina manera ha de visualitzar un document a la pantalla d’un ordinador.

L’XML (eXtensible Markup Language, llenguatge de marques extensible) és un llenguatge d’etiquetes desenvolupat pel World Wide Web Consortium (W3C) que no tan sols serveix per aplicar-lo a Internet, sinó també com a estàndard per a l’intercanvi d’informació entre diferents plataformes.

L’XLIFF (XML Localisation Interchange File Format) és un tipus d’XML específic per a l’intercanvi d’informació entre les diverses eines que intervenen en un procés de localització.

Altres formats traduïbles que contenen informació en etiquetes i que s’utilitzen sovint per a la programació d’aplicacions són els arxius PHP, PO i .strings.

Per a la traducció de pàgines web, és recomanable proporcionar el contingut al traductor en un d’aquests formats, ja sigui extraient un arxiu en format XML,  XLIFF o Excel des del gestor de continguts de la nostra web o descarregant directament els arxius HTML.

Traducció d’arxius amb format d’etiquetes

El principal inconvenient per a la traducció d’aquest tipus d’arxius és que el text que s’ha de traduir es troba barrejat entre tot d’etiquetes que no s’han de modificar si volem mantenir l’estructura i la presentació del text.
Aquí és on entren en acció les eines de traducció assistida per ordinador (TAO) com les que fem servir a Ampersand Traduccions, ja que aquests programes disposen de filtres que, en el moment d’importar un arxiu per traduir, en reconeixen l’extensió i oculten tot allò que no sigui text traduïble i que el traductor no hauria de modificar per tal que el format de l’arxiu traduït es mantingui intacte.