Skip to content

Commit

Permalink
Final version for SS 2020
Browse files Browse the repository at this point in the history
  • Loading branch information
Simon-Stone authored Apr 21, 2020
1 parent cf23a3f commit 2c4770f
Showing 1 changed file with 6 additions and 7 deletions.
13 changes: 6 additions & 7 deletions Preprocessing/Lego-Sets/Lego Sets Preprocessing.ipynb
Original file line number Diff line number Diff line change
Expand Up @@ -98,7 +98,7 @@
},
"source": [
"Wie Sie nun wissen sollten, werden die Daten der Lego-Sets als [``DataFrame``](https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.html#pandas.DataFrame) gespeichert. \n",
"Ein ``DataFrame`` ist eine tabellarische Datenstruktur in pandas, die einen geordneten Satz von Spalten enthält. Jede Spalte kann einen anderen Daetntyp haben (numerisch, string, boolesch usw.). Ein ``DataFrame`` hat sowohl einen Zeilenindex als auch einen Spaltenindex.\n",
"Ein ``DataFrame`` ist eine tabellarische Datenstruktur in pandas, die einen geordneten Satz von Spalten enthält. Jede Spalte kann einen anderen Datentyp haben (numerisch, string, boolesch usw.). Ein ``DataFrame`` hat sowohl einen Zeilenindex als auch einen Spaltenindex.\n",
"\n",
"Um einen schnellen Blick auf die Datenstruktur werfen zu können, bietet pandas die Funktionen [``head()``](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.head.html) und [``tail()``](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.tail.html#pandas.DataFrame.tail), um sich die ersten oder letzten Zeilen der Struktur anzeigen zu lassen."
]
Expand Down Expand Up @@ -547,7 +547,7 @@
"Diese Abbildung können wir leicht mithilfe von ``map()`` vornehmen:\n",
"\n",
"````python\n",
"some_dataFrame.map({'key1': 'value1', 'key2': 'value2'}, na_action='ignore')\n",
"some_dataFrame = some_dataFrame.map({'key1': 'value1', 'key2': 'value2'}, na_action='ignore')\n",
"````\n",
"__Hinweis:__ Da wir die fehlenden Werte (``na``) noch nicht eingefüllt haben, sollte das Argument ``na_action='ignore'`` gesetzt werden, damit die ``na`` Werte einfach durchgereicht werden."
]
Expand Down Expand Up @@ -650,7 +650,7 @@
"categorical_column = some_dataFrame['non_categorical_column'].astype('category')\n",
"```\n",
"\n",
"Die kategoriale Variable kann dann wiederum in einen numerischen Typ gewandelt werden, indem wir uns den Code der ausgeben lassen, der jeder Stufe der Variable zugewiesen wird:\n",
"Die kategoriale Variable kann dann wiederum in einen numerischen Typ gewandelt werden, indem wir uns den Code ausgeben lassen, der jeder Stufe der Variable zugewiesen wird:\n",
"\n",
"```python\n",
"numerical_categorical_column = categorical_column.cat.codes\n",
Expand Down Expand Up @@ -778,15 +778,15 @@
"source": [
"# Verwenden Sie str.extract() und den String r'(?:(?P<high>\\d+)(?:” high))' um die erste Höhenangabe in Inch zu extrahieren\n",
"\n",
"# Die Breite finden Sie mit r'(?:(?P<high>\\d+)(?:” high))'\n",
"# Die Breite finden Sie mit r'(?:(?P<wide>\\d+)(?:” wide))'\n",
"\n",
"# Die Länge finden Sie mit r'(?:(?P<long>\\d+)(?:” long))'\n",
"\n",
"# Fügen Sie die Dimensionen als neue Spalten 'height', 'width', 'length' in den DataFrame lego_data ein\n",
"\n",
"\n",
"\n",
"# Entefernen Sie die Spalte 'prod_long_desc'\n"
"# Entfernen Sie die Spalte 'prod_long_desc'\n"
]
},
{
Expand Down Expand Up @@ -852,7 +852,7 @@
"\n",
"```python\n",
"some_dataFrame[columns].mean() # Gibt Mittelwerte der Spalten <columns> zurück\n",
"some_dataFrame[columns].mode() # Gibt häufigste Werte der Spalten <columns> zurück ACHTUNG: Rückgabewert ist nicht skalar\n",
"some_dataFrame[columns].mode() # Gibt häufigste Werte der Spalten <columns> zurück ACHTUNG: Rückgabewert ist nicht skalar!\n",
"some_dataFrame[columns].fillna(value) # Füllt alle fehlenden Werte in den Spalten <columns> mit <value> auf\n",
"```\n",
"\n"
Expand Down Expand Up @@ -932,7 +932,6 @@
}
],
"metadata": {
"celltoolbar": "Edit Metadata",
"kernelspec": {
"display_name": "Python 3",
"language": "python",
Expand Down

0 comments on commit 2c4770f

Please sign in to comment.