Skip to content

Commit

Permalink
fix build from 16-4-24
Browse files Browse the repository at this point in the history
  • Loading branch information
martindroege committed Apr 17, 2024
1 parent bcfcf61 commit d33311f
Show file tree
Hide file tree
Showing 4 changed files with 4 additions and 4 deletions.
2 changes: 1 addition & 1 deletion _toc.yml
Original file line number Diff line number Diff line change
Expand Up @@ -18,7 +18,7 @@ parts:
title: Installation von Packages
- file: ch01-api/03-intro-api.ipynb
title: Einführung Web APIs
- file: ch01-api/03-webseite-runterladen.ipynb
- file: ch01-api/04-webseite-runterladen.ipynb
title: Webseite dowloaden
- file: ch01-api/05-exkurs-html.md
title: Exkurs HTML
Expand Down
File renamed without changes.
2 changes: 1 addition & 1 deletion ch01-api/05-exkurs-html.md
Original file line number Diff line number Diff line change
@@ -1,5 +1,5 @@
(html-basics)=
## Exkurs: HTML-Basics
# Exkurs: HTML-Basics

Wie Sie feststellen werden, handelt es sich bei heruntergeladenen Websites jeweils um ein HTML-Dokument, das die Grundlage für die im Browser visualisierte Repräsentation ist. Wie der Datentyp *string* nahelegt, sind HTML-Dokumente reine Textdateien, deren Inhalte durch Tags und Elemente genauer spezifiziert werden und dem Browser signalisieren, wie die entsprechenden Inhalte dargestellt werden sollen. Wenn wir diese Inhalte nun extrahieren wollen, dann müssen wir uns die Struktur des HTML-Dokuments genau anschauen.

Expand Down
4 changes: 2 additions & 2 deletions ch01-api/06-beautiful-soup.ipynb
Original file line number Diff line number Diff line change
Expand Up @@ -56,7 +56,7 @@
"cell_type": "markdown",
"metadata": {},
"source": [
"### Informationen aus der HTML-Struktur auslesen\n",
"## Informationen aus der HTML-Struktur auslesen\n",
"\n",
"Um den Umgang mit HTML-Dokumente zu üben, nutzen wir als Beispiel die Landing-Page der Professur für Digital History. In den nachfolgenden Codeblöcken sehen Sie einige Beispiele dafür, wie Sie unterschiedliche Elemente innerhalb des Dokuments aufrufen können. \n",
"\n",
Expand Down Expand Up @@ -101,7 +101,7 @@
"cell_type": "markdown",
"metadata": {},
"source": [
"### Ein HTML-Dokument durchsuchen\n",
"## Ein HTML-Dokument durchsuchen\n",
"Tags können verschiedene {term}`Attribute` haben, Anker-Tags beispielsweise das Attribut \"href\", das wiederum häufig eine URL als Wert hat. Wenn wir nicht nur den ersten Link abrufen wollen, sondern alle, dann können wir die Methode `find_all(tagname, attrs, recursive, string, limit, **kwargs)` einsetzen. Der Methode werden quasi Filter übergeben anhand derer das HTML-Dokument analysiert wird. Es werden alle Nachkommen (*descendants*) eines Tags durchsucht und nur diejenigen zurückgegeben, die Ihrem definierten Filter entsprechen.\n",
"\n",
"Genutzt werden können dazu einfache Strings oder Listen, um auf Tag-Namen oder Attribute zu referieren, aber auch [Reguläre Ausdrücke](regex). Hier einige Beispiele:"
Expand Down

0 comments on commit d33311f

Please sign in to comment.