Traducción profesional de archivos CSV, ¿qué se debe tener en cuenta?

Agencia de traducción Traductorexprés - Nuestro gestor de proyectos Boris
Nuestros especialistas en tecnología de la información estarán encantados de ayudarle.
CSV son las siglas inglesas de Comma Separated Values o Character Separated Values (valores separados por comas). Tal y como su nombre indica, los valores se separan mediante signos. El uso de este formato no está estandarizado de forma general, pero se explica detalladamente en el documento RFC 4180. Los archivos CSV son ideales para hacer traducciones, aunque existen ciertas cuestiones que se deben tener en cuenta.

Sistemas que utilizan archivos CSV

Hay muchas aplicaciones y sistemas específicos de cada cliente que utilizan el formato CSV. A menudo se utiliza este formato para exportar informaciones de bases de datos, por ejemplo, en sistemas de gestión de contenidos. A pesar de que existen muchas opciones para importar y exportar información en las bases de datos, el uso de archivos CSV es la solución más sencilla. Si el resultado tiene que ser más estructurado, se puede utilizar el formato XML, en el que también puede introducirse un archivo CSV.

Página de códigos o Codepage

Una página de códigos consiste en una asignación entre números y signos. De las cuales Unicode es el formato más usual y UTF-8 la codificación más usada para signos de Unicode. Cuando se utilizan archivos CVS codificados con UTF-8, estos pueden traducirse a todos los idiomas. Igualmente funciona con otras páginas de códigos, pero entonces hay que asegurarse de que no existe ninguna referencia al formato en el que está codificado el archivo CSV, porque eso podría causar problemas.

Si el archivo está, por ejemplo, en formato ANSI con caracteres occidentales y debe ser traducido a caracteres orientales, nos percatamos de inmediato de que les corresponden otras letras a los caracteres. Esto se debe a que el formato ANSI tiene unas posibilidades limitadas. Por ello, es recomendable utilizar Unicode desde el principio, por ejemplo, mediante UTF-8.

Cómo crear archivos CSV impecables

El desafío de los archivos CSV yace en no subestimar el complejo proceso de creación. Por ejemplo, en el caso de querer convertir en archivo CSV una base de datos tabular con varias casillas, se debe proceder de la siguiente manera:

Las casillas se separan mediante signos, por ejemplo, una coma o un punto y coma. Un conjunto de datos finaliza con cada nuevo renglón del documento. Por lo que normalmente un archivo CSV comienza en la primera línea con el nombre de las columnas de la tabla.

Si no aparece ninguna coma en el texto de la tabla, todo es correcto y el archivo no tiene fallos. Sin embargo, ¿qué sucede si hay una coma en el texto? Esto ocasionará un desplazamiento involuntario del texto que puede aparecer de repente, por ejemplo, en casillas que no tengan denominación.

La manera correcta de crear una casilla en la que hay una coma que a su vez debe funcionar como separador de dos casillas es utilizando comillas al principio y al final del texto de dicha casilla. Hay quien siempre utiliza este método, y hay quien sólo lo usa cuando es estrictamente necesario.

La cosa se complica un poco más cuando el texto de por sí también contiene comillas. En tal caso es necesario establecer una codificación especial que establezca que las comillas no indican el final de un campo. En Microsoft Excel simplemente hay que repetir las comillas de modo que aparezcan por partida doble. En otros programas, se puede elegir el símbolo que señalará que las comillas no indican el final de la casilla.

Datos que pueden introducirse en un archivo CSV

Por norma general, un archivo CSV puede contener cualquier tipo de texto. Nuestros gestores de proyecto han tenido casos con HTML y XML en archivos CSV. En ambos casos ha funcionado sin problemas. Sin embargo, también nos ha sucedido en alguna ocasión que, al utilizar una herramienta estándar para exportar un archivo al formato CSV, todo parecía normal al principio y después resultó que la herramienta no podía crear casillas que contuviesen más de 32.768 caracteres. Por supuesto que pueden surgir dificultades como ésta en casos aislados, pero la rápida y profesional reacción de nuestro equipo evitó males mayores.

2018-03-30T07:54:23.5590109Z

Boris Rösch
Comuníquese con nuestro experto

Nuestro experto le atenderá con gusto y responderá sus preguntas

Male83950
customer service
American Translators Association LogoLogo of EUATC and VViNProz logoDIN CERTCO logoKiva supporter logo