Etiqueta: lenguaje de marcas

Traducir archivos de lenguaje de marcas: HTML, XML, XLIFF

¿Qué es el lenguaje de marcas?

El lenguaje de marcas (markup language en inglés) es un sistema para codificar un documento combinando texto y etiquetas o marcas que contienen información adicional sobre la estructura del texto y su presentación.

La idea y el nombre surgieron de las anotaciones que los editores escribían en los manuscritos con instrucciones de revisión y maquetación del documento para la imprenta. Así, este mismo concepto se trasladó mediante el lenguaje de marcas al mundo de la informática.

Tipos principales de lenguaje de marcas para la traducción

html, etiquetes, tags, llenguatge de marquesEl lenguaje de marcas más extendido y conocido es el HTML (HyperText Markup Language, lenguaje de marcas de hipertexto) y es la base de la World Wide Web, ya que se usa para indicar a un navegador de qué modo tiene que visualizar un documento en la pantalla de un ordenador.

El XML (eXtensible Markup Language, lenguaje de marcas extensible) es un lenguaje de etiquetas desarrollado por el World Wide Web Consortium (W3C) que no tan solo sirve para aplicarlo en Internet, sino también como estándar para el intercambio de información entre diferentes plataformas.

El XLIFF (XML Localisation Interchange File Format) es un tipo de XML específico para el intercambio de información entre las diferentes herramientas que intervienen en un proceso de localización.

Otros formatos traducibles que contienen información en etiquetas y que se utilizan a menudo para la programación de aplicaciones son los archivos PHP, PO y .strings.

Para la traducción de páginas web, es recomendable proporcionar el contenido al traductor en uno de estos formatos, ya sea extrayendo un archivo en formato XML, XLIFF o Excel desde el gestor de contenidos de nuestra web o descargando directamente los archivos HTML.

Traducción de archivos con formato de etiquetas

El principal inconveniente para la traducción de este tipo de archivos es que el texto que hay que traducir se encuentra mezclado entre todo tipo de etiquetas que no se deben modificar si queremos mantener la estructura y la presentación del texto.

Entonces es cuando entran en acción las herramientas de traducción asistida por ordenador (TAO) como las que empleamos en Ampersand Traducciones, ya que estos programas disponen de filtros que, en el momento de importar un archivo traducido, reconocen su extensión y ocultan todo lo que no sea texto traducible y que el traductor no tendría que modificar para que el formato del archivo traducido se mantenga intacto.

Los mejores formatos para traducir: word, excel, html, etc.

Muchas veces se habla de los mejores formatos para traducir y es que, a pesar de que se puede traducir cualquier tipo de documentación en cualquier formato de texto (Word, Excel, PDF, PowerPoint, etc.), es importante destacar que existen algunos formatos más «favorables» que otros, tanto para el traductor como para las herramientas de traducción asistida que utiliza.
Los mejores formatos para traducir

Por suerte, hoy en día los traductores profesionales utilizamos herramientas tecnológicas que nos permiten optimizar los procesos de traducción y la calidad del texto resultante. Estas herramientas se pueden utilizar únicamente con determinados formatos de archivo: formatos originales editables. Esto quiere decir que los mejores formatos para traducir y poder utilitzar este tipo de tecnologías son documentos originales en formatos como los siguientes: Word, Excel, PowerPoint, html, xml, formatos de intercambio de InDesign, FrameMaker, etc.

Al trabajar con este tipo de archivos, la traducción se realiza utilizando todas las herramientas tecnológicas disponibles y esto permite, entre otras cosas:

  • Optimizar los procesos de traducción.
  • Reducir los plazos de entrega.
  • Reducir los costes de traducción.
  • Conseguir homogeneidad y coherencia en toda la documentación traducida.
  • Utilizar glosarios terminológicos y memorias de traducción.
  • Devolver la traducción en el mismo formato que el documento original, manteniendo también los formatos de texto como interlineados, negritas, colores, espacios, mayúsculas, enlaces, etc.

Cuando no se dispone de este tipo de formatos, sino que los archivos que se entregan para traducir son PDF, jpg, png y similares, los procesos adquieren mayor complejidad porque es necesario realizar un trabajo previo de adaptación del documento para poder realizar la traducción optimizando al máximo los procesos.