Comunidad de diseño web y desarrollo en internet

Usa Unicode

Un idiota no se curará hasta que se muera.
Proverbio japonés

A la hora de almacenar archivos de texto, podemos elegir entre bastantes codificaciones, que viene a ser qué numerito (y de qué tamaño en bits) se asigna a cada carácter.

¿Qué es lo que pasa cuando abrimos un archivo en una codificación (por ejemplo, la Shift-JIS que es una japonesa) y le decimos que la lea con otra (la ISO 8850-1, de caracteres latinos)? Pues que obtenemos un motón de símbolos extraños. Esto pasa, por ejemplo, cuando alguien me envía un trackback1 con una codificación distinta a la que uso en el blog.

1Los trackback son un tipo especial de “comentarios” en los blogs. Cuando alguien de otro blog te enlaza al tuyo, si te manda un trackback, aparecerá en tu post un comentario con la URL del blog de la otra persona. Es útil para saber quién habla sobre cosas que has dicho.

¿Pero qué pasa si se quiere hacer un documento multilingüe con distintos alfabetos? ¿Qué pasa si desde una aplicación quiero leer cualquier documento en cualquier lengua? Para esto existe una codificación de caracteres estándar, que es la Unicode. Sacado de su web.

Unicode proporciona un número único para cada carácter, sin importar la plataforma, ni el programa, ni la lengua.

Existen varios formatos de Unicode, el más usado es el UTF-8 y está bastante extendido en la Red. De hecho, en la blogosfera hispana las dos codificaciones más usadas son la ISO 8859-1 y la UTf-8. Usar Unicode es bueno y es la codificación estándar. Usadla.

 

Información adicional

Contenido publicado bajo licencia Creative Commons. Belén Albeza (BenKo)

Si tienes alguna pregunta de este ejemplo; puedes hacerla aqui en los foros.