Die utf8_encode-Funktion in PHP
Dieser Artikel stellt die Funktion utf8_encode()
vor und erklärt ihren Zweck mit Codebeispielen.
Einführung in UTF-8 und die Funktion utf8_encode()
in PHP
UTF-8 ist eine für Unicode verwendete Zeichenkodierung. Es wurde erfunden, weil das vorhandene ASCII nicht alle vorhandenen Zeichen codieren konnte.
ASCII ist auf die Speicherung von nur 256 Zeichen beschränkt und kann nur für englische Alphabete (Groß- und Kleinbuchstaben) und einige Sonderzeichen verwendet werden. Dann entstand eine andere Kodierung, da sich die Webseiten mit vielen weltweit verwendeten Sprachen und ihren Sonderzeichen befassten.
ASCII konnte aufgrund seines begrenzten Platzes nicht alle aufnehmen. Daher wurde das Konzept von Unicode eingeführt.
Durch die Verwendung von Codepunkten kann Unicode unzählige Zeichen speichern.
UTF-8 ordnet jeden Codepunkt seinem binären Äquivalent zu. Wie der Name schon sagt, verwendet es 8 Bits, um ein Zeichen zu speichern.
In PHP konvertiert die Funktion utf8_encode()
den ISO-8859-1
-String in die entsprechende UTF-8-Version. Der String ISO-8859-1
ist ein Zeichensatz, der in HTML 4.01 verwendet wurde.
Die ersten 128 Zeichen, die von diesem Satz dargestellt werden, sind die gleichen wie ASCII.
Allerdings prüft die Funktion utf8_encode()
nicht, ob ihr Parameter ein ISO-8859-1
-String ist. Die Funktion gibt eine in UTF-8 übersetzte Zeichenfolge zurück.
Sehen wir uns unten ein Beispiel für die Verwendung der Funktion an.
Beispielcode:
$iso_string = "1 2 3";
$utf8_string = utf8_encode($iso_string);
echo $utf8_string;
Ausgang:
1 2 3
Im obigen Beispiel sind die Strings 1 2 3
die ISO-8859-1
-Kodierungen, übersetzt in UTF-8-Strings. Dabei entspricht 1
1
, 2
entspricht 2
und 3
entspricht 3
.
Zweck der Funktion utf8_encode()
in PHP
Der utf8_encode()
dreht sich um das Konzept der UTF-8-Kodierung. Die Kodierung kann verwendet werden, um Unicode von einem Computer auf einen anderen zu übertragen.
Die Funktion utf8_encode()
kommt zum Einsatz, wenn wir einige Sonderzeichen in unserer PHP-Anwendung kodieren müssen.
Speichern Sie beispielsweise ein Zeichen क
, ein Devanagari-Skript, in der Variablen $char
. Verwenden Sie die Funktion utf8_encode()
, um das codierte Zeichen zu codieren und zu drucken.
Wenn die Datei bereits mit UTF-8 kodiert ist, müssen die Sonderzeichen nicht mit der Funktion utf8_encode()
kodiert werden.
Beispielcode:
$char = "क";
$utf8_string = utf8_encode($char);
echo $utf8_string;
Ausgang:
à¤
Hier fungiert das UTF-8-codierte Zeichen à¤
als universeller Code für das Zeichen क
, der im Internet verwendet werden kann. Der Computer wandelt die Codierung in Maschinensprache um, eine Folge von Bytes, um sie zu interpretieren.
Subodh is a proactive software engineer, specialized in fintech industry and a writer who loves to express his software development learnings and set of skills through blogs and articles.
LinkedIn