HTML mit HTTP-Anfragen in Python abrufen
HTTP oder Hypertext Transfer Protocol ist die Grundlage des Internets oder des World Wide Web (WWW). Im Wesentlichen handelt es sich um ein Protokoll auf Anwendungsebene, das für die Übertragung von Daten von Webservern an Webbrowser wie Chrome, Firefox und Brave gedacht ist. HTTP-Anfragen werden an eindeutige Webadressen oder URLs gesendet, um erforderliche Ressourcen und Hypermedia-Dokumente wie HTML (Hypertext Markup Language) abzurufen. Ein URL oder Uniform Resource Locator ist eine eindeutige Webadresse, die zum Auffinden von Inhalten über das Internet verwendet wird. Der Zielinhalt kann HTML-Dateien und Textdateien, Bilder, Audios, Videos, ZIP-Dateien und ausführbare Dateien sein.
In diesem Handbuch erfahren Sie, wie Sie mithilfe von HTTP-Anfragen mit Python HTML unter einer URL abrufen können.
Senden von HTTP-Anfragen mit dem Modul requests
in Python
Die requests
ist ein Python-Paket, das es uns ermöglicht, HTTP-Anfragen über das Internet zu senden. Wir können dieses Modul verwenden, um HTTP-Anfragen an eine URL zu senden und HTML und andere wichtige Details abzurufen. Das Modul requests
verfügt über eine Methode get()
, die eine GET-Anfrage an die angegebene URL sendet und ein Objekt vom Typ requests.Response
zurückgibt. Wir verwenden diese Methode und die zurückgegebene Antwort, um HTML-Inhalt abzurufen. Lesen Sie den folgenden Code für das Python-Programm.
import requests
r = requests.get("https://www.google.com")
print("Status Code:", r.status_code)
print("URL:", r.url)
print("HTML:\n", r.text)
Ausgabe:
Status Code: 200
URL: https://www.google.com/
HTML:
...
Im obigen Code haben wir zuerst eine GET-Anfrage an https://www.google.com
gestellt und die zurückgegebene Antwort wurde in der Variablen r
gespeichert. Das Attribut text
in der Antwort gibt den HTML-Inhalt zurück. Die Ausgabe zeigt nicht den HTML-Inhalt, sondern ...
, weil er für eine bessere Lesbarkeit des Artikels zu groß war.