La traducción de archivos en formato PDF

Ampersand

¿Qué es el PDF?

El formato PDF (la sigla proviene del inglés portable document format, formato de documento portátil) es un formato de archivo para documentos digitales que mantiene el contenido de un documento, como sus características de navegación, los gráficos y los formatos de visualización, independientemente del sistema con que se visualice.

Pueden contener texto, elementos multimedia, como vídeos o sonido, y elementos de hipertexto, como vínculos, marcadores y enlaces. Además, permiten la encriptación para proteger el contenido e incluso se pueden firmar electrónicamente.

El formato PDF fue desarrollado por Adobe para su sistema Acrobat a principios de los años noventa y se lanzó como estándar abierto en 2008. Se trata de un formato independiente de los dispositivos, útil para transmitir documentos a través de Internet.

La norma ISO-32000-1 (en inglés) de 2008 establece que el PDF es un formato estándar para el intercambio y la visualización de documentos digitales.

Tipos de PDF

Tratamiento del formato PDF para la traducción

Para los traductores, el PDF no es un formato ideal para trabajar, ya que proviene de algún otro formato original y, por sus características de seguridad, es difícil de editar. Por eso, aunque sea compatible con muchas herramientas de traducción asistida, no es recomendable trabajar con archivos PDF directamente para traducir.

Si el cliente no nos puede proporcionar el documento en el formato editable original, tendremos que buscar la manera de extraer el texto para traducirlo intentado mantener sus características en la medida de lo posible.

Si se trata de un PDF basado en texto, normalmente solo tendremos que seleccionar, copiar y pegar el texto en un procesador de texto, repasarlo y arreglar el formato para que sea similar al original.

En cambio, si tenemos que trabajar con un PDF no extraíble, necesitaremos un programa de reconocimiento de texto (OCR: Optical Character Recognition, reconocimiento óptico de caracteres), como ABBY FineReader, que detecte el texto del documento y nos permita exportarlo en un formato editable. El resultado dependerá de la calidad de la imagen y lo más probable es que requiera un trabajo de edición considerable antes del proceso de traducción.

OCR, reconocimiento de caracteres, formato PDF, traducción

Sin embargo, en algunas ocasiones, la calidad de la imagen del PDF puede ser muy baja o los documentos contienen texto manuscrito, en cuyo caso los programas no pueden reconocer el texto. Entonces, no hay más remedio que traducir directamente a la vista y, posteriormente, revisar a fondo la traducción para comprobar que no falta nada.

Corrección, revisión y galeradas en PDF

Una función interesante para los traductores es la edición de los PDF extraíbles para servicios de revisión y de corrección. Adobe Acrobat, así como otros programas similares, permite insertar comentarios, subrayar, resaltar y tachar el texto, insertar formas, etc. Estas opciones son compatibles con la versión gratuita (Adobe Reader) si el documento ha sido habilitado para este fin por un usuario con la edición de pago (Adobe Acrobat Pro).

formato PDF, comentarios, editar, galeradas

Estas opciones son especialmente útiles cuando nos encargan un servicio de galeradas o revisión de arte final. Las galeradas se realizan sobre traducciones que ya hemos hecho en la empresa y sirven para dar el toque final a una traducción maquetada por el cliente. Suelen aplicarse a trabajos publicitarios, que luego pueden convertirse en carteles enormes, folletos de gran difusión, etc.