La función utf8_encode en PHP
Este artículo presentará la función utf8_encode() y explicará su propósito con ejemplos de código.
Introducción a UTF-8 y la función utf8_encode() en PHP
UTF-8 es una codificación de caracteres utilizada para Unicode. Se inventó porque el ASCII existente no podía codificar todos los caracteres existentes.
ASCII se limita a almacenar solo 256 caracteres y solo se puede usar para alfabetos en inglés (mayúsculas y minúsculas) y algunos caracteres especiales. Luego, surgió otra codificación ya que las páginas web trataban con muchos idiomas que se usan en todo el mundo y sus caracteres especiales.
ASCII no podía contenerlos todos debido a su espacio limitado. Por lo tanto, se introdujo el concepto de Unicode.
Con el uso de puntos de código, Unicode puede almacenar innumerables caracteres.
UTF-8 asigna cada punto de código a su equivalente binario. Como el nombre habla por sí mismo, utiliza 8 bits para almacenar un carácter.
En PHP, la función utf8_encode() convierte la cadena ISO-8859-1 a su versión UTF-8 equivalente. La cadena ISO-8859-1 es un conjunto de caracteres que se utilizó en HTML 4.01.
Los primeros 128 caracteres representados por este conjunto son los mismos que ASCII.
Sin embargo, la función utf8_encode() no verifica si su parámetro es una cadena ISO-8859-1. La función devuelve una cadena traducida UTF-8.
Veamos un ejemplo a continuación del uso de la función.
Código de ejemplo:
$iso_string = "1 2 3";
$utf8_string = utf8_encode($iso_string);
echo $utf8_string;
Producción :
1 2 3
En el ejemplo anterior, las cadenas 1 2 3 son las codificaciones ISO-8859-1, traducidas a cadenas UTF-8. Aquí, 1 equivale a 1, 2 a 2 y 3 a 3.
Propósito de la función utf8_encode() en PHP
El utf8_encode() gira en torno al concepto de la codificación UTF-8. La codificación se puede usar para transferir Unicode de una computadora a otra.
La función utf8_encode() se utiliza cuando necesitamos codificar algunos caracteres especiales en nuestra aplicación PHP.
Por ejemplo, almacene un carácter क, un script de Devanagari, en la variable $char. Utilice la función utf8_encode() para codificar e imprimir el carácter codificado.
Si el archivo ya está codificado con UTF-8, no es necesario codificar los caracteres especiales con la función utf8_encode().
Código de ejemplo:
$char = "क";
$utf8_string = utf8_encode($char);
echo $utf8_string;
Producción :
à¤
Aquí, el carácter codificado en UTF-8, à¤, actúa como un código universal para el carácter क que se puede utilizar en Internet. La computadora convierte la codificación en lenguaje máquina, una secuencia de bytes, para su interpretación.
Subodh is a proactive software engineer, specialized in fintech industry and a writer who loves to express his software development learnings and set of skills through blogs and articles.
LinkedIn