Etiqueta: traducció de pàgines web

Traduir arxius de llenguatge de marques: HTML, XML, XLIFF

Què és el llenguatge de marques?

El llenguatge de marques (markup language en anglès) és un sistema de codificar un document combinant text i etiquetes o marques que contenen informació addicional sobre l’estructura del text i la seva presentació.

La idea i el nom van sorgir de les anotacions que els editors escrivien als manuscrits amb instruccions de revisió i maquetació del document per a la impremta. De la mateixa manera, aquest concepte es va traslladar mitjançant el llenguatge de marques al món de la informàtica.

Tipus principals de llenguatge de marques per a la traducció

html, etiquetes, tags, llenguatge de marquesEl llenguatge de marques més estès i conegut és l’HTML (HyperText Markup Language, llenguatge de marques d’hipertext) i és la base de la World Wide Web, ja que es fa servir per indicar a un navegador de quina manera ha de visualitzar un document a la pantalla d’un ordinador.

L’XML (eXtensible Markup Language, llenguatge de marques extensible) és un llenguatge d’etiquetes desenvolupat pel World Wide Web Consortium (W3C) que no tan sols serveix per aplicar-lo a Internet, sinó també com a estàndard per a l’intercanvi d’informació entre diferents plataformes.

L’XLIFF (XML Localisation Interchange File Format) és un tipus d’XML específic per a l’intercanvi d’informació entre les diverses eines que intervenen en un procés de localització.

Altres formats traduïbles que contenen informació en etiquetes i que s’utilitzen sovint per a la programació d’aplicacions són els arxius PHP, PO i .strings.

Per a la traducció de pàgines web, és recomanable proporcionar el contingut al traductor en un d’aquests formats, ja sigui extraient un arxiu en format XML,  XLIFF o Excel des del gestor de continguts de la nostra web o descarregant directament els arxius HTML.

Traducció d’arxius amb format d’etiquetes

El principal inconvenient per a la traducció d’aquest tipus d’arxius és que el text que s’ha de traduir es troba barrejat entre tot d’etiquetes que no s’han de modificar si volem mantenir l’estructura i la presentació del text.
Aquí és on entren en acció les eines de traducció assistida per ordinador (TAO) com les que fem servir a Ampersand Traduccions, ja que aquests programes disposen de filtres que, en el moment d’importar un arxiu per traduir, en reconeixen l’extensió i oculten tot allò que no sigui text traduïble i que el traductor no hauria de modificar per tal que el format de l’arxiu traduït es mantingui intacte.

Ampersand: traducció turística a Barcelona

Barcelona, una ciutat multilingüe

Ampersand Traduccions té les oficines al cor de Barcelona, una ciutat banyada pel mar i també, com a destinació turística de primer ordre, per les onades de turistes que la visiten cada any. Per això, coneixem de primera mà les necessitats de traducció i, des de fa més de 20 anys, us oferim els nostres serveis de traducció turística a Barcelona en una gran varietat d’idiomes.

La importància d’atendre el client en la seva llengua

Amb tants visitants i residents estrangers, i sabent que Barcelona és la tercera ciutat europea amb més despesa turística per darrere de Londres i París i que Catalunya va ser la comunitat autònoma on més diners es van gastar els turistes estrangers el 2015, és més rellevant que mai la idea que atendre el client en la seva llengua és una formalitat elemental en qualsevol tipus de negoci.

Llengües amb més necessitat de traducció

Pel que fa a les llengües a les quals hi ha més demanda de traducció, el rànquing del 2015 sobre les nacionalitats dels turistes que pernocten a Barcelona coincideix aproximadament amb les necessitats que hem detectat:

Turistes que van pernoctar a Barcelona l'any 2015Variació en relació amb l'any 2014
1. Estats Units: 725.285+10,6%
2. Regne Unit: 719.109+6,2%
3. França: 675.255-0,8%
4. Itàlia: 541.091+11,7%
5. Alemanya: 499.364+2,3%
6. Holanda: 234.122+5,2%
7. Japó: 169.247-1%
8. Suïssa: 167.442+9,3%
9. Bèlgica: 145.955-3%
10. Rússia: 140.975-29,2%

Traduir, per què?

traducció, turisme, Barcelona, traducció turística a BarcelonaOferir un servei o un producte a mida per als vostres clients no us servirà de res si el vostre públic objectiu no se n’assabenta. Si voleu que us trobin i que allò que oferiu tingui un abast mundial haureu de recórrer a la traducció. El vostre client us sabrà agrair l’esforç que feu per comunicar-vos-hi perquè:

  • El 80% dels consumidors esperen ser atesos en la seva llengua quan fan transaccions comercials.
  • Més de la meitat dels consumidors estan disposats a pagar un preu més alt per un producte o servei si la documentació i la informació complementària estan en la seva llengua.
  • Més de la meitat dels consumidors compren només en pàgines web en què la informació se’ls presenta en la seva llengua.
  • Els visitants d’una pàgina web són entre tres i quatre vegades més propensos a comprar si el contingut està en la seva llengua.
  • Els usuaris d’Internet passen el doble de temps en una pàgina web si té el contingut en la seva llengua.

Errors comuns a les traduccions informàtiques

En aquesta entrada volem fer un resum a manera de taula d’errors comuns a les traduccions informàtiques, ja que és habitual navegar per una pàgina web o una aplicació i trobar expressions que, molt sovint, són traduccions literals de l’anglès al català o bé traduccions que en un altre context són correctes però que en el de la informàtica no ho són. Parlem del que es coneix com «falsos amics de la traducció informàtica»:

AnglèsTraducció no recomanadaTraducció recomanada
bannerbannerbàner
click (to)clickejar, cliquejarfer clic, clicar
dll libraryllibreria dll
biblioteca dll
onlineonlineen línia
passwordpassword
contrasenya
release
alliberament, llançament
distribució, publicació, lliurament, versió
remove
remoure (una aplicació)
treure, esborrar, eliminar, desinstal•lar
run
córrer (un programa)obrir, executar, iniciar
state-of-the-art
estat de l'art
tecnologia punta, d'avantguarda, d'última generació
supportsuportaradmetre, ser compatible amb

Tanmateix, en alguns casos, tot i que la normativa recomana fer servir una forma traduïda o adaptada al català, és possible que aquesta no tingui èxit entre els professionals del sector. Un dels motius d’aquest rebuig és que, en moltes ocasions, els organismes reguladors adopten una resolució contrària a l’ús ja establert i ja és massa tard per aconseguir implantar-la amb èxit.

Aquests són alguns exemples de termes d’aquesta categoria que cal tenir en compte per tal de no cometre alguns dels errors comuns a les traduccions informàtiques:

AnglèsTerme recomanatTerme utilitzat habitualment
cookiegaleta
cookie
hardwaremaquinarihardware
routerencaminadorrouter
softwareprogramarisoftware

Les traduccions d’aquesta taula són les propostes que ha fet el Termcat, organisme encarregat de sistematitzar i difondre la terminologia de la llengua catalana, en què participen la Generalitat de Catalunya, l’Institut d’Estudis Catalans i el Consorci per a la Normalització Lingüística. Una altra font de consulta pel que fa a terminologia informàtica en català és Softcatalà, associació sense ànim de lucre que té l’objectiu de difondre l’ús de la llengua catalana en l’àmbit de la informàtica i evitar aquests errors comuns a les traduccions informàtiques al català.


El fet és que aquest és un camp del saber que evoluciona a una gran velocitat i de manera contínua. Per això, per aconseguir traduccions adequades, és necessari disposar de traductors professionals que dominin la terminologia informàtica, coneguin aquest camp i recorrin a eines i glossaris terminològics actualitzats i fiables.

 

Com extreure el contingut d’una pàgina web

Extreure el contingut d’una pàgina web és el primer pas per traduir-la i, moltes vegades, es tracta d’un pas crític: malgrat que cada dia es tradueixen llocs web a tot el món, molts no han estat pensats perquè se’n pugui extreure fàcilment el contingut en un format editable que permeti traduir els textos d’una manera àgil i carregar-los posteriorment al sistema. A conseqüència d’això, és habitual acabar fent la temuda acció de «copia i enganxa» per enviar a l’empresa de traducció un document Word per traduir i, després, lliurar als programadors les traduccions en Word perquè les incorporin a la web d’una manera més o menys manual.

Com podem suposar, aquest procés, a més d’implicar temps i recursos, facilita la introducció d’errors perquè, com que es tracta manualment el contingut original i la traducció, és molt possible que ens descuidem textos o que introduïm algun error a la traducció. Per això, tot seguit expliquem algunes opcions per extreure el contingut d’una pàgina web que poden ser útils tant per al client de traduccions com per al traductor:

  • Extracció directa des del gestor de continguts. Si la pàgina web funciona amb un gestor de continguts (per exemple, WordPress o Blogspot) és molt probable que hi hagi l’opció d’extreure el contingut en un arxiu editable. Un dels més habituals és el format XML, tot i que determinats gestors permeten exportar el contingut a arxius XLIFF o Excel. En el cas de WordPress, per exemple, només cal fer uns quants clics i podrem exportar el contingut a format XML i reimportar el corresponent a entrades, comentaris, camps personalitzats, categories i etiquetes. Aquests arxius poden ser processats per l’agència de traducció, que pot traduir-los i retornar-los en aquest mateix format, de manera que l’usuari només ha d’importar el fitxer i s’estalvia el procés de remaquetació. En el cas de gestors de continguts més avançats, també és habitual la possibilitat d’extreure els continguts en un arxiu XML o d’altres formats (XLIFF, Excel), però és necessari contactar amb el programador del vostre gestor de continguts perquè us assessori sobre com podeu fer-ho.
  • Extreure el contingut d’un web mitjançant un gestor de descàrregues. Hi ha programes que permeten descarregar els continguts d’un lloc web. Amb aquests programes és possible descarregar els arxius HTML, PDF, PNG, JPG, etc., ubicats en un lloc HTTP. Una vegada descarregats els continguts que volem traduir només és necessari facilitar aquests arxius a l’agència de traducció perquè en faci la traducció i ens la torni en el mateix format, per tal que el programador carregui al nostre web directament el nou contingut.
  • Extracció en fitxers PO. La majoria de les aplicacions de software lliure (per exemple, Drupal o WordPress) fan servir arxius d’extensió PO, que són arxius de text estructurat. Algunes agències de traducció professional, com ara Ampersand Traduccions, treballen amb eines de traducció assistida que permeten editar arxius PO i lliurar les traduccions en aquest mateix format, per la qual cosa si heu de traduir aquests arxius PO només caldrà que els faciliteu a la vostra agència de traducció.

Extreure el contingut d'una web

Finalment, tal com comentàvem la nostra entrada Traducció de pàgines web: la importància del testing, després d’introduir el contingut traduït al lloc web és recomanable fer un testing per comprovar que tot sigui al seu lloc: que les opcions (botons, menús, etc.) mostrin el text complet, que els enllaços funcionin, que la longitud del text traduït no afecti la presentació de la web, etc.

L’ortografia afecta el posicionament a Google?

Cada vegada és més habitual que les empreses encarreguin la traducció de la seva pàgina web per posicionar-la al cercador de Google dels mercats als quals s’adrecen, però: l’ortografia afecta el posicionament a Google?

És important que aquesta feina s’encarregui a professionals qualificats que siguin capaços de:

  • Fer una traducció adaptada al mercat objectiu i als seus costums per tal d’evitar malentesos i de facilitar la comunicació amb el client. Si no presentem la informació d’una manera acceptable per a l’usuari, no comprarà.
  • Fer servir una ortografia i una sintaxi correctes, ja que els errors tenen repercussions davant dels seus clients i davant de Google. D’una banda, els errors ortogràfics poden donar una mala imatge de l’empresa; de l’altra, poden afectar la vostra aparició a les cerques de Google: si el vostre web conté errors ortogràfics i els usuaris fan cerques amb l’ortografia correcta, no apareixerà entre els resultats de la cerca. Així de senzill.

El febrer de 2011 Google va posar en funcionament Google Panda, la qual cosa va implicar un canvi important en l’algoritme d’indexació de les pàgines web per oferir resultats de cerca més bons: Panda premia els llocs amb continguts de més qualitat i fa perdre posicions als que ofereixen continguts de menys qualitat.

Inicialment es pensava que aquest algoritme també valorava la qualitat de l’escriptura des del punt de vista ortogràfic o de l’estil, així com l’interès de la informació per als lectors i que, per tant, les faltes d’ortografia penalitzaven la qualitat i, en conseqüència, el posicionament.

Tanmateix, no és exactament així. Segons Matt Cutts, enginyer de l’equip de qualitat de cerca de Google, el fet que molts llocs web incloguin en una mateixa pàgina text en diverses llengües i la impossibilitat de reconèixer amb exactitud tots els idiomes que es fan servir a Internet fan que no es tinguin en compte les faltes d’ortografia a l’hora d’establir la qualitat d’un lloc. Podeu veure les seves explicacions en aquest vídeo:

Així, doncs, en resum, tot i que Google no tingui en compte l’ortografia per decidir la qualitat d’una web, sembla que l’ortografia afecta el posicionament a Google ja que el buscador no localitzarà la web si els usuaris fan cerques sense faltes d’ortografia. En aquest sentit, per tant, una manera d’ajudar a la millora del posicionament del vostre web és que les traduccions les facin traductors professionals que assegurin la qualitat del contingut publicat.

 

Traducció de pàgines web: la importància del testing

La traducció de pàgines web es pot considerar una especialitat per si mateixa, independentment que el contingut al qual faci referència el web sigui tècnic, publicitari o d’una altra mena.

Com ja hem comentat en entrades anteriors, les particularitats de la traducció de pàgines web tenen molt a veure amb tots els aspectes relacionats amb la programació dels continguts. En aquest sentit, en aquesta entrada volem insistir en la importància del testing o verificació sempre que es maqueti contingut nou en qualsevol idioma.

El procés de maquetació web és la transformació del disseny d’un producte o servei en un conjunt d’arxius que els navegadors web puguin reproduir.

traducció de pàgines webQuan es tradueix una pàgina web i es maqueta el contingut traduït és molt possible que es produeixin incompatibilitats entre els dissenys ja establerts a la web (espais, caixes de text, pestanyes, etc.) i el nou contingut.

Per exemple, si es tracta d’una traducció del castellà a l’alemany, és possible que una paraula en alemany no tingui cabuda en la caixa de text existent, ja que les dimensions d’aquella caixa de text s’havien establert pensant en l’extensió de la paraula en castellà, que acostuma a ser més curta que en alemany.

Un altre dels motius pels quals resulta imprescindible fer un testing dels webs traduïts és assegurar-se que la terminologia i l’estil de la traducció s’adaptin a la imatge i el missatge general del web. En el procés de testing, el traductor pot verificar la terminologia i adaptar-la quan sigui necessari.

En darrer lloc, és important recordar que en molts casos el programador/maquetador no té coneixements de l’idioma que està maquetant (per exemple, és molt probable que el maquetador d’una web espanyola que ha decidit traduir la seva pàgina al rus per exportar a Rússia no tingui coneixements d’aquest idioma, per la qual cosa les possibilitats de cometre algun error d’escriptura o de còpia en el procés de maquetació són força elevades. Amb el procés de testing, el traductor pot corregir aquests errors en cas que n’hi hagi.

Per tot això, quan parlem de traducció de pàgines web cal destacar la importància del testing abans de publicar el nou contingut, sobretot si es tracta de contingut redactat en idiomes molt diferents de l’idioma natiu de l’empresa, ja que les probabilitats d’error augmenten considerablement.

Idiomes més utilitzats a Internet

Veient els darrers estudis publicats, no ens ha estranyat que els idiomes més utilitzats a Internet siguin l’anglès i el xinès.

Internet ha facilitat i continua facilitant la superació de les barreres de la internacionalització de moltes empreses, ja que el simple fet de disposar d’una pàgina web en l’idioma local permet entrar en contacte amb aquell mercat i generar més vendes i un millor reconeixement de la marca, així com millorar la comunicació amb el client.

Així ho demostra l’últim estudi ELAN, en el qual es reflecteix que l’adaptació de les pàgines web a la llengua i la cultura del client és una pràctica freqüent: més del 50% de les empreses participants en l’estudi, establertes en 22 països, tenen pàgines web en idiomes diferents del seu nacional, i un 60% d’elles fa servir l’anglès.

idiomes internet

Segons aquest estudi, per exemple, Rapina Paberivabrik (una empresa d’Estònia) ha traduït la seva pàgina web a sis idiomes: rus, anglès, letó, finès, lituà i romanès. L’empresa va mesurar quin impacte tenia fer servir idiomes locals a la seva pàgina web i va observar un augment del 16-25% de les vendes en les pàgines web adaptades.

Si analitzem els llocs web de les grans corporacions internacionals, com ara Coca-Cola o Google, veurem que els seus webs tenen més de 40 idiomes i que la tendència és continuar incrementant el nombre d’idiomes disponibles. Moltes d’aquestes corporacions han afegit quatre idiomes o més en els darrers 12 mesos. Entre els idiomes de ràpid creixement a Internet hi ha l’hongarès, el turc, l’indonesi i el rus.

Tot seguit us detallem les darreres dades publicades per Internet World Stats amb referència als idiomes més utilitzats a Internet:

ELS 10 IDIOMES MÉS UTILITZATS
A INTERNET
Usuaris d'Internet
per idioma
Penetració
d'Internet
per idioma
Creixement
a Internet
(2000-2011)
% del total
d'usuaris
d'Internet
Població mundial
d'aquest idioma
(estimació 2011)
Anglès565.004.12643,4%301,4%26,8%1.302.275.670
Xinès

509.965.01337,2%1.478,7%24,2%1.372.226.042
Castellà164.968.74239,0%807,4%7,8%423.085.806
Japonès99.182.00078,4%110,7%4,7%126.475.664
Portuguès82.586.60032,5% 990,1%3,9%253.947.594
Alemany75.422.67479,5%174,1%3,6%94.842.656
Àrab65.365.40018,8% 2.501,2%3,3%347.002.991
Francès59.779.52517,2%398,2%3,0%347.932.305
Rus59.700.00042,8%1.825,8%3,0%139.390.205
Coreà39.440.00055,2% 107,1%2,0%71.393.343
10 IDIOMES MÉS UTILITZATS
1.615.957.33336,4%421,2%82,2%4.442.056.069
Resta d'idiomes
350.557.48314,6%588,5%17,8%2.403.553.891
TOTAL MUNDIAL2.099.926.96530,3% 481,7%100,0%6.930.055.154

NOTES:
(1) Estadístiques sobre els deu idiomes més utilitzats a Internet actualitzades en data 31 de maig de 2011. (2) La penetració d’Internet és la ràtio entre el nombre d’usuaris d’Internet que parlen un idioma concret i el nombre total aproximat de parlants d’aquell idioma. (3) La informació més recent sobre l’ús d’Internet prové de dades publicades per Nielsen Online, International Telecommunications Union, GfK i altres fonts fiables. (4) La informació sobre la població mundial prové de la  U.S. Census Bureau. (5) Si necessiteu ajuda per a la navegació i les definicions en diversos idiomes, consulteu la Site Surfing Guide. (6) Es poden citar les estadístiques sempre que se citi la font i s’inclogui un enllaç actiu a Internet World Stats. Copyright © 2012, Miniwatts Marketing Group. Tots els drets reservats a tot el món.

Exemples per a la interpretació de les dades:
– 99.182.000 parlants de japonès fan servir Internet, la qual cosa representa el 4,7% dels usuaris d’Internet de tot el món.
– El 78,4% de les 126.475.664 persones que parlen japonès al món fan servir Internet.
– El nombre d’usuaris d’Internet que parlen japonès s’ha incrementat un 110,7% en els darrers onze anys (2000-2011).

En vista de les dades d’aquest estudi, com creieu que evolucionaran els idiomes més utilitzats a Internet en els pròxims anys?