Externe Bibliotheken

Wenn wir die Python Grundlagen einigermaßen beherrschen können wir schnell produktiv werden. Das ist sicher ein Vorteil von Python. Es muss nicht alles verstanden werden, um die Sprache in vielfältiger Weise einsetzen zu können.

In diesem Buch wollen wir die externen Bibliotheken

  • Numpy

  • Matplotlib

  • Scipy

  • Pandas

  • Seaborn

kennen lernen. Diese Bibliotheken sind nicht Teil der Python-Standardbibliothek und müssen somit nachinstalliert werden. Diese Bibliotheken stellen jedoch die Basis für viele Felder und andere Bibliotheken dar. Deswegen sollte jeder Python-Interessierte sich mit diesen vertraut machen. Der Funktionsumfang ist aber mittlerweile gewaltig und füllt ganze Bücher. Es gilt also das Prinzip oberflächliches kennenlernen, und tiefes Lernen, wenn notwendig.

Beinahe alle Projekte bieten ein Tutorial oder einen sogenannten Quickstart an. Es wird empfohlen diese durchzugehen, um einen gewissen Überblick zu gewinnen.

NumPy

NumPy bringt mächtige Datentypen für die wissenschaftliche Programmierung, vor allen die mehrdimensionalen Arrays verschiedener Datentypen. Diese erlauben eine moderne Matrizen- und Tensorrechnung und sind somit sehr gut geeignet Algorithmen in einer kompakten Form zu implementieren. Weiters bietet NumPy auch vielen Methoden aus der linearen Algebra oder der Fourier Analyse. Es sei aber darauf hingewiesen, dass diese auch zunehmend in SciPy implementiert werden. NumPy und SciPy haben gemeinsame Wurzeln und sind nicht einfach zu trennen. Die offizielle Webseite ist unter https://numpy.org/ zu erreichen.

Matplotlib

Matplotlib ist die wohl meist genutzte Bibliothek für die Visualisierung in Python. Es gibt aber viele weiter Projekte wie Seaborn, Plotly, Bokeh, Altair und Folium. Die Visualisierung in Python ist also in gewisser Weise ungelöst und jedes dieser Projekte versucht schwächen von Matplotlib zu adressieren. Nichtsdestotrotz ist und bleibt Matplotlib die wichtigste Visualisierungsbibliotheken und sollte deshalb studiert werden. Die offizielle Webseite ist unter https://matplotlib.org/ zu erreichen.

SciPy

SciPy stellt gemeinsam mit NumPy die Basis vieler Projekte. Mittels SciPy können viele Probleme aus der wissenschaftlichen Programmierung gelöst werden. Auch Ingenieure sollten ein Überblick über SciPy bekommen. Es können viele Probleme mit vordefinierten Modulen und Methoden elegant gelöst werden. SciPy wird ständig weiterentwickelt und hat dadurch einen sehr großen Funktionsumfang. Die offizielle Webseite ist unter https://scipy.org/ zu erreichen.

Pandas

Pandas erlaubt die Durchführung der Datenanalyse und Datenmanipulation in einer eleganten Weise. Durch Pandas stehen eine Vielzahl von Methoden für das Einlesen von Daten zur Verfügung. Diese Daten können dann effizient inspiziert und bereinigt werden. Danach erfolgt meist ein erneutes Abspeichern des bereinigten Datensatzes oder eine direkte Weiterverarbeitung. Die offizielle Webseite ist unter https://pandas.pydata.org/ zu erreichen.

Seaborn

Mit Pandas wird auch oft auch Seaborn verwendet. Seaborn ist eine Visualisierungsbibliothek welche auf Matplotlib aufbaut, welche jedoch ein high-level Interface bietet, welche das Erstellen von Diagrammen erleichtert. Seaborn ist zielt stärker auf Visual Analytics-Methoden. Die offizielle Webseite ist unter https://seaborn.pydata.org/ zu erreichen.