La función utf8_encode en PHP
Este artículo presentará la función utf8_encode()
y explicará su propósito con ejemplos de código.
Introducción a UTF-8 y la función utf8_encode()
en PHP
UTF-8 es una codificación de caracteres utilizada para Unicode. Se inventó porque el ASCII existente no podía codificar todos los caracteres existentes.
ASCII se limita a almacenar solo 256 caracteres y solo se puede usar para alfabetos en inglés (mayúsculas y minúsculas) y algunos caracteres especiales. Luego, surgió otra codificación ya que las páginas web trataban con muchos idiomas que se usan en todo el mundo y sus caracteres especiales.
ASCII no podía contenerlos todos debido a su espacio limitado. Por lo tanto, se introdujo el concepto de Unicode.
Con el uso de puntos de código, Unicode puede almacenar innumerables caracteres.
UTF-8 asigna cada punto de código a su equivalente binario. Como el nombre habla por sí mismo, utiliza 8 bits para almacenar un carácter.
En PHP, la función utf8_encode()
convierte la cadena ISO-8859-1
a su versión UTF-8 equivalente. La cadena ISO-8859-1
es un conjunto de caracteres que se utilizó en HTML 4.01.
Los primeros 128 caracteres representados por este conjunto son los mismos que ASCII.
Sin embargo, la función utf8_encode()
no verifica si su parámetro es una cadena ISO-8859-1
. La función devuelve una cadena traducida UTF-8.
Veamos un ejemplo a continuación del uso de la función.
Código de ejemplo:
$iso_string = "1 2 3";
$utf8_string = utf8_encode($iso_string);
echo $utf8_string;
Producción :
1 2 3
En el ejemplo anterior, las cadenas 1 2 3
son las codificaciones ISO-8859-1
, traducidas a cadenas UTF-8. Aquí, 1
equivale a 1
, 2
a 2
y 3
a 3
.
Propósito de la función utf8_encode()
en PHP
El utf8_encode()
gira en torno al concepto de la codificación UTF-8. La codificación se puede usar para transferir Unicode de una computadora a otra.
La función utf8_encode()
se utiliza cuando necesitamos codificar algunos caracteres especiales en nuestra aplicación PHP.
Por ejemplo, almacene un carácter क
, un script de Devanagari, en la variable $char
. Utilice la función utf8_encode()
para codificar e imprimir el carácter codificado.
Si el archivo ya está codificado con UTF-8, no es necesario codificar los caracteres especiales con la función utf8_encode()
.
Código de ejemplo:
$char = "क";
$utf8_string = utf8_encode($char);
echo $utf8_string;
Producción :
à¤
Aquí, el carácter codificado en UTF-8, à¤
, actúa como un código universal para el carácter क
que se puede utilizar en Internet. La computadora convierte la codificación en lenguaje máquina, una secuencia de bytes, para su interpretación.
Subodh is a proactive software engineer, specialized in fintech industry and a writer who loves to express his software development learnings and set of skills through blogs and articles.
LinkedIn