Etiqueta: formato PDF

La traducción de archivos en formato PDF

¿Qué es el PDF?

El formato PDF (la sigla proviene del inglés portable document format, formato de documento portátil) es un formato de archivo para documentos digitales que mantiene el contenido de un documento, como sus características de navegación, los gráficos y los formatos de visualización, independientemente del sistema con que se visualice.

Pueden contener texto, elementos multimedia, como vídeos o sonido, y elementos de hipertexto, como vínculos, marcadores y enlaces. Además, permiten la encriptación para proteger el contenido e incluso se pueden firmar electrónicamente.

El formato PDF fue desarrollado por Adobe para su sistema Acrobat a principios de los años noventa y se lanzó como estándar abierto en 2008. Se trata de un formato independiente de los dispositivos, útil para transmitir documentos a través de Internet.

La norma ISO-32000-1 (en inglés) de 2008 establece que el PDF es un formato estándar para el intercambio y la visualización de documentos digitales.

Tipos de PDF

  • Extraíbles (basados en texto): este tipo de PDF permite la búsqueda de palabras en el documento, así como copiar y pegar el texto. Ejemplo: un documento de un procesador de texto, como el MS Word, que se ha guardado en PDF.
  • No extraíbles (basados en imágenes): este tipo de PDF se presenta como una imagen y no permite buscar por palabras ni copiar el texto para pegarlo. Ejemplo: un escaneo de un documento guardado en PDF.

Tratamiento del formato PDF para la traducción

Para los traductores, el PDF no es un formato ideal para trabajar, ya que proviene de algún otro formato original y, por sus características de seguridad, es difícil de editar. Por eso, aunque sea compatible con muchas herramientas de traducción asistida, no es recomendable trabajar con archivos PDF directamente para traducir.

Si el cliente no nos puede proporcionar el documento en el formato editable original, tendremos que buscar la manera de extraer el texto para traducirlo intentado mantener sus características en la medida de lo posible.

Si se trata de un PDF basado en texto, normalmente solo tendremos que seleccionar, copiar y pegar el texto en un procesador de texto, repasarlo y arreglar el formato para que sea similar al original.

En cambio, si tenemos que trabajar con un PDF no extraíble, necesitaremos un programa de reconocimiento de texto (OCR: Optical Character Recognition, reconocimiento óptico de caracteres), como ABBY FineReader, que detecte el texto del documento y nos permita exportarlo en un formato editable. El resultado dependerá de la calidad de la imagen y lo más probable es que requiera un trabajo de edición considerable antes del proceso de traducción.

OCR, reconocimiento de caracteres, formato PDF, traducción

Sin embargo, en algunas ocasiones, la calidad de la imagen del PDF puede ser muy baja o los documentos contienen texto manuscrito, en cuyo caso los programas no pueden reconocer el texto. Entonces, no hay más remedio que traducir directamente a la vista y, posteriormente, revisar a fondo la traducción para comprobar que no falta nada.

Corrección, revisión y galeradas en PDF

Una función interesante para los traductores es la edición de los PDF extraíbles para servicios de revisión y de corrección. Adobe Acrobat, así como otros programas similares, permite insertar comentarios, subrayar, resaltar y tachar el texto, insertar formas, etc. Estas opciones son compatibles con la versión gratuita (Adobe Reader) si el documento ha sido habilitado para este fin por un usuario con la edición de pago (Adobe Acrobat Pro).

formato PDF, comentarios, editar, galeradas

Estas opciones son especialmente útiles cuando nos encargan un servicio de galeradas o revisión de arte final. Las galeradas se realizan sobre traducciones que ya hemos hecho en la empresa y sirven para dar el toque final a una traducción maquetada por el cliente. Suelen aplicarse a trabajos publicitarios, que luego pueden convertirse en carteles enormes, folletos de gran difusión, etc.

Los mejores formatos para traducir: word, excel, html, etc.

Muchas veces se habla de los mejores formatos para traducir y es que, a pesar de que se puede traducir cualquier tipo de documentación en cualquier formato de texto (Word, Excel, PDF, PowerPoint, etc.), es importante destacar que existen algunos formatos más «favorables» que otros, tanto para el traductor como para las herramientas de traducción asistida que utiliza.
Los mejores formatos para traducir

Por suerte, hoy en día los traductores profesionales utilizamos herramientas tecnológicas que nos permiten optimizar los procesos de traducción y la calidad del texto resultante. Estas herramientas se pueden utilizar únicamente con determinados formatos de archivo: formatos originales editables. Esto quiere decir que los mejores formatos para traducir y poder utilitzar este tipo de tecnologías son documentos originales en formatos como los siguientes: Word, Excel, PowerPoint, html, xml, formatos de intercambio de InDesign, FrameMaker, etc.

Al trabajar con este tipo de archivos, la traducción se realiza utilizando todas las herramientas tecnológicas disponibles y esto permite, entre otras cosas:

  • Optimizar los procesos de traducción.
  • Reducir los plazos de entrega.
  • Reducir los costes de traducción.
  • Conseguir homogeneidad y coherencia en toda la documentación traducida.
  • Utilizar glosarios terminológicos y memorias de traducción.
  • Devolver la traducción en el mismo formato que el documento original, manteniendo también los formatos de texto como interlineados, negritas, colores, espacios, mayúsculas, enlaces, etc.

Cuando no se dispone de este tipo de formatos, sino que los archivos que se entregan para traducir son PDF, jpg, png y similares, los procesos adquieren mayor complejidad porque es necesario realizar un trabajo previo de adaptación del documento para poder realizar la traducción optimizando al máximo los procesos.