Etiqueta: etiquetes

Traduir arxius de llenguatge de marques: HTML, XML, XLIFF

Què és el llenguatge de marques?

El llenguatge de marques (markup language en anglès) és un sistema de codificar un document combinant text i etiquetes o marques que contenen informació addicional sobre l’estructura del text i la seva presentació.

La idea i el nom van sorgir de les anotacions que els editors escrivien als manuscrits amb instruccions de revisió i maquetació del document per a la impremta. De la mateixa manera, aquest concepte es va traslladar mitjançant el llenguatge de marques al món de la informàtica.

Tipus principals de llenguatge de marques per a la traducció

html, etiquetes, tags, llenguatge de marquesEl llenguatge de marques més estès i conegut és l’HTML (HyperText Markup Language, llenguatge de marques d’hipertext) i és la base de la World Wide Web, ja que es fa servir per indicar a un navegador de quina manera ha de visualitzar un document a la pantalla d’un ordinador.

L’XML (eXtensible Markup Language, llenguatge de marques extensible) és un llenguatge d’etiquetes desenvolupat pel World Wide Web Consortium (W3C) que no tan sols serveix per aplicar-lo a Internet, sinó també com a estàndard per a l’intercanvi d’informació entre diferents plataformes.

L’XLIFF (XML Localisation Interchange File Format) és un tipus d’XML específic per a l’intercanvi d’informació entre les diverses eines que intervenen en un procés de localització.

Altres formats traduïbles que contenen informació en etiquetes i que s’utilitzen sovint per a la programació d’aplicacions són els arxius PHP, PO i .strings.

Per a la traducció de pàgines web, és recomanable proporcionar el contingut al traductor en un d’aquests formats, ja sigui extraient un arxiu en format XML,  XLIFF o Excel des del gestor de continguts de la nostra web o descarregant directament els arxius HTML.

Traducció d’arxius amb format d’etiquetes

El principal inconvenient per a la traducció d’aquest tipus d’arxius és que el text que s’ha de traduir es troba barrejat entre tot d’etiquetes que no s’han de modificar si volem mantenir l’estructura i la presentació del text.
Aquí és on entren en acció les eines de traducció assistida per ordinador (TAO) com les que fem servir a Ampersand Traduccions, ja que aquests programes disposen de filtres que, en el moment d’importar un arxiu per traduir, en reconeixen l’extensió i oculten tot allò que no sigui text traduïble i que el traductor no hauria de modificar per tal que el format de l’arxiu traduït es mantingui intacte.

Avantatges de la traducció assistida per ordinador

Les eines de traducció assistida per ordinador (CAT tools en anglès: Computer Assisted Translation) són la resposta de la informàtica aplicada a la millora de l’eficiència del procés traductor. Es tracta de programes que ajuden el traductor a optimitzar el procés de traducció tot recreant un entorn adequat per desenvolupar la seva feina.

A diferència dels sistemes de traducció automàtica, les eines de traducció assistida per ordinador permeten aprofitar traduccions dutes a terme per traductors humans i gestionar de manera eficaç les repeticions internes d’un text. En un inici, es tractava principalment de complements que s’integraven dins d’un processador de text, però actualment es treballa amb programes independents amb una interfície pròpia o també amb eines en línia.

Com funcionen les eines de traducció assistida per ordinador?

Les eines de traducció assistida per ordinador (TAO) analitzen els arxius que s’han de traduir, en divideixen el contingut en segments i els preparen per tal que puguin ser traduïts per un traductor. La funció principal de les eines TAO és emmagatzemar les traduccions d’aquests segments en bases de dades anomenades memòries de traducció, de manera que puguem recuperar la traducció d’un segment que ja haguem traduït anteriorment. A més, el programa és capaç de detectar similituds entre els segments nous per traduir i d’altres ja emmagatzemats, de manera que l’eina ens mostrarà aquesta informació i ens permetrà acceptar-la, rebutjar-la o modificar-la.

Les eines de traducció assistida també disposen d’una altra funcionalitat important: les bases de dades terminològiques. Podem crear bases de dades multilingües amb entrades terminològiques de diversos camps d’especialitat per tal d’evitar perdre el temps fent consultes terminològiques que ja hàgim fet prèviament i per assegurar la coherència terminològica al llarg de la traducció.

Com treballem a Ampersand Traduccions?

A Ampersand Traduccions fem servir un dels programes líders del sector per gestionar i dur a terme la gran majoria dels nostres encàrrecs de traducció. Això ens permet optimitzar els processos i oferir traduccions de qualitat amb terminis de lliurament més ajustats i tarifes de traducció competitives.

Els avantatges de la TAO

A part de les memòries de traducció i les bases de dades terminològiques, aquests programes també disposen de filtres que, en el moment d’importar un arxiu per traduir, en reconeixen l’extensió i oculten tot allò que no sigui text traduïble i que el traductor no hauria de modificar, com ara etiquetes de format en arxius .html, .xml, .xliff, .php, etc. D’aquesta manera, ens assegurem que, un cop exportada la traducció, el format de l’arxiu traduït es mantingui intacte.traducció assistida per ordinador, TAO, etiquetes, filtres

Altres funcionalitats d’aquests programes són la incorporació de correctors ortogràfics per evitar els errors de tecleig o les faltes d’ortografia, la possibilitat de dur a terme cerques en fonts externes, com ara diccionaris en línia, o una eina de control de qualitat que abans d’exportar la traducció ens avisa si hi ha algun criteri preestablert que no es compleix, com ara si es detecten dos espais seguits o hi falta alguna etiqueta.

En definitiva, per bé que la traducció sigui un talent, o fins i tot un art, i per això seleccionem els millors professionals de la traducció, creiem que la tecnologia ha de fer un gran paper en totes les seves fases i sobretot en el mateix procés de traducció. La raó de tot plegat és que la qualitat és la finalitat última i el concepte orientador de la nostra activitat.

Els millors formats per traduir: word, excel, html, etc.

Molt sovint es parla dels millors formats per traduir, i és que, malgrat que es pot traduir qualsevol tipus de documentació en qualsevol format de text (Word, Excel, PDF, PowerPoint, etc.), és important destacar que hi ha alguns formats que són considerats com els millors formats per traduir, tant per al traductor com per a les eines de traducció assistida que fa servir.

Els millors formats per traduir

Per sort, avui dia els traductors professionals fem servir eines tecnològiques que ens permeten optimitzar els processos de traducció i la qualitat del text resultant. Aquestes eines es poden fer servir únicament amb determinats formats d’arxiu: formats originals editables. Això vol dir que els formats òptims per a aquest tipus de tecnologies són documents originals en formats com ara els següents: Word, Excel, PowerPoint, html, xml, formats d’intercanvi d’InDesign, FrameMaker, etc.

Quan es treballa amb aquest tipus d’arxius, la traducció es fa fent servir totes les eines tecnològiques disponibles i això permet, entre altres coses:

  • Optimitzar els processos de traducció.
  • Reduir els terminis de lliurament.
  • Reduir els costos de traducció.
  • Aconseguir homogeneïtat i coherència en tota la documentació traduïda.
  • Fer servir glossaris terminològics i memòries de traducció.
  • Retornar la traducció en el mateix format que el document original, mantenint també els formats de text, com ara interlineats, negretes, colors, espais, majúscules, enllaços, etc.

Quan no es disposa d’aquest tipus de formats, sinó que els arxius que es lliuren per traduir són PDF, jpg, png i similars, els processos adquireixen més complexitat, perquè és necessari fer una feina prèvia d’adaptació del document per poder fer la traducció optimitzant al màxim els procediments.