Eroberung der Python-Standardbibliothek①

Wussten Sie, dass Python über zehntausende von externen Bibliotheken verfügt, aber die leistungsstärksten Werkzeuge bereits in der Standardbibliothek enthalten sind?

Diese Serie hat das Thema 'Vertiefung der Python-Standardbibliothek', und wir werden jede Standardbibliothek sorgfältig untersuchen, die häufig verwendet, aber nicht tiefgehend behandelt wird.

Das Ziel ist nicht nur eine einfache Aufzählung von Funktionen, sondern die Konzepte anhand praktischer Beispiele zu verstehen und das Code-Anwendungsvermögen zu verbessern, um Ihre Python-Nutzung auf die nächste Stufe zu heben.

Vertiefte Nutzung von collections: Von den Grundlagen bis zur praktischen Anwendung

1. Warum mit `collections` anfangen?

collections ergänzt die eingebauten Datentypen von Python (list, dict, tuple) und bietet sehr effiziente fortgeschrittene Sammlungen in Bezug auf Leistung und Struktur. Sie treten häufig in der Praxis auf, werden jedoch oft nicht tiefgehend behandelt.

In diesem Artikel werde ich mich auf die fünf praktischsten Klassen konzentrieren und Ihnen erklären, 'warum man sie verwendet', 'wie man sie verwendet' und 'wann man sie am besten einsetzt'.

2. `Counter` – Die klassische Frequenzzählung und mehr

Count all the things!

Grundkonzept

collections.Counter ist eine sehr nützliche Klasse, die im Python-Standardbibliotheksmodul collections enthalten ist. Es ist buchstäblich ein "Zähler", eine spezielle Art von Dictionary, das optimiert ist, um die Häufigkeit des Datenauftretens zu zählen.

from collections import Counter

c = Counter(['a', 'b', 'c', 'a', 'b', 'a'])
print(c)  # Counter({'a': 3, 'b': 2, 'c': 1})

Durch Eingabe von iterierbaren Objekten (z. B. Listen, Strings, Tupel, Dictionaries) wird eine Datenstruktur erzeugt, die zählt, wie oft jedes Element vorkommt.

Hauptfunktionen und -methoden

📌 Verschiedene Initialisierungsarten

Counter(['a', 'b', 'a'])          # Initialisierung mit Listen oder anderen Iterablen
Counter({'a': 2, 'b': 1})         # Initialisierung im Dictionary-Format
Counter(a=2, b=1)                 # Initialisierung mit Keyword-Argumenten

📌 Zugriff auf Elemente

c = Counter('hello')
print(c['l'])  # 2
print(c['x'])  # 0 (gibt 0 zurück, ohne KeyError)

📌 Hinzufügen/Ändern von Elementen

c['l'] += 3
print(c)  # Counter({'l': 5, 'o': 1, 'h': 1, 'e': 1})

📌 `most_common(n)` – gibt die n häufigsten Elemente zurück

c = Counter('banana')
print(c.most_common(2))  # list of tuples in the form [('a', 3), ('n', 2)]

📌 `elements()` – ein Iterator, der jedes Element so oft wiederholt, wie es seinem Auftreten entspricht

list(Counter('banana').elements())  # Umwandlung des Iterators in eine Liste zur Überprüfung

📌 Unterstützt mathematische Operationen (Addition, Subtraktion, Schnittmenge und Vereinigung zwischen Countern)

c1 = Counter(a=3, b=1)
c2 = Counter(a=1, b=2)

print(c1 + c2)  # Counter({'a': 4, 'b': 3})
print(c1 - c2)  # Counter({'a': 2}) → negative Werte werden ausgeschlossen
print(c1 & c2)  # Schnittmenge: Minimum Counter({'a': 1, 'b': 1})
print(c1 | c2)  # Vereinigung: Maximum Counter({'a': 3, 'b': 2})

Praktische Anwendungsbeispiele

📌 Analyse von Wörtern in einem Text

text = "the quick brown fox jumps over the lazy dog"
counter = Counter(text.split())
print(counter)

📌 Analyse der Log-Häufigkeit

logs = ['INFO', 'ERROR', 'INFO', 'DEBUG', 'ERROR', 'ERROR']
print(Counter(logs))  # Counter({'ERROR': 3, 'INFO': 2, 'DEBUG': 1})

📌 Zählung von doppelten Elementen in einer Liste

nums = [1, 2, 2, 3, 3, 3]
print(Counter(nums))  # Counter({3: 3, 2: 2, 1: 1})

Wichtige Hinweise

Counter erbt von dict, garantiert jedoch keine Sortierung. Wenn die Reihenfolge wichtig ist, sollten Sie most_common() verwenden.
Wenn Werte auf 0 oder darunter fallen, werden die Elemente nicht entfernt und müssen möglicherweise manuell gefiltert werden.

c = Counter(a=3)
c.subtract({'a': 5})
print(c)  # Counter({'a': -2})  # Beachten Sie, dass das Element nicht entfernt wird, selbst wenn der Wert auf 0 oder darunter fällt.

Tipp: So accumuliert man ohne Initialisierung

counter = Counter()
with open("data.txt") as f:
    for line in f:
        counter.update(line.strip().split())

Zusammenfassung

collections.Counter ist ein leistungsstarkes Werkzeug, das nahezu unverzichtbar für Datenanalyse, Log-Verarbeitung und Text-Mining ist. Für Anfänger ist es ein einfaches Werkzeug zur Frequenzzählung, während es für Fortgeschrittene zu einem hoch entwickelten Verarbeitungstool mit Operations- und Filterkombinationen werden kann.

Vorschau auf den nächsten Teil

defaultdict – Eine Welt ohne KeyError, flexibler als dict!

Allein durch das 'tiefe Verständnis und die ordnungsgemäße Verwendung der Standardbibliothek' wird sich die Qualität Ihres Codes sicher verbessern.

Eroberung der Python-Standardbibliothek① - collections.Counter

Vertiefte Nutzung von collections: Von den Grundlagen bis zur praktischen Anwendung

1. Warum mit `collections` anfangen?

2. `Counter` – Die klassische Frequenzzählung und mehr

Grundkonzept

Hauptfunktionen und -methoden

📌 Verschiedene Initialisierungsarten

📌 Zugriff auf Elemente

📌 Hinzufügen/Ändern von Elementen

📌 `most_common(n)` – gibt die n häufigsten Elemente zurück

📌 `elements()` – ein Iterator, der jedes Element so oft wiederholt, wie es seinem Auftreten entspricht

📌 Unterstützt mathematische Operationen (Addition, Subtraktion, Schnittmenge und Vereinigung zwischen Countern)

Praktische Anwendungsbeispiele

📌 Analyse von Wörtern in einem Text

📌 Analyse der Log-Häufigkeit

📌 Zählung von doppelten Elementen in einer Liste

Wichtige Hinweise

Tipp: So accumuliert man ohne Initialisierung

Zusammenfassung

Vorschau auf den nächsten Teil

whitedec

Ähnliche Beiträge

[Python Standardbibliothek – 4] random-Modul nutzen: Auswahl, Stichproben, Shuffle, Reproduzierbarkeit

[Python Standard Library – 0] Was ist die Python Standard Library? Ein Leitfaden für Anfänger

Python Standardbibliothek Meisterschaft 3 - pathlib

Gleicher Name, andere Ergebnisse: So nutzen Sie urlencode in Django-Projekten korrekt

Hinterlasse einen Kommentar

Fügen Sie einen neuen Kommentar hinzu

Vertiefte Nutzung von collections: Von den Grundlagen bis zur praktischen Anwendung

1. Warum mit collections anfangen?

2. Counter – Die klassische Frequenzzählung und mehr

Grundkonzept

Hauptfunktionen und -methoden

📌 Verschiedene Initialisierungsarten

📌 Zugriff auf Elemente

📌 Hinzufügen/Ändern von Elementen

📌 most_common(n) – gibt die n häufigsten Elemente zurück

📌 elements() – ein Iterator, der jedes Element so oft wiederholt, wie es seinem Auftreten entspricht

📌 Unterstützt mathematische Operationen (Addition, Subtraktion, Schnittmenge und Vereinigung zwischen Countern)

Praktische Anwendungsbeispiele

📌 Analyse von Wörtern in einem Text

📌 Analyse der Log-Häufigkeit

📌 Zählung von doppelten Elementen in einer Liste

Wichtige Hinweise

Tipp: So accumuliert man ohne Initialisierung

Zusammenfassung

Vorschau auf den nächsten Teil

whitedec

Ähnliche Beiträge

[Python Standardbibliothek – 4] random-Modul nutzen: Auswahl, Stichproben, Shuffle, Reproduzierbarkeit

[Python Standard Library – 0] Was ist die Python Standard Library? Ein Leitfaden für Anfänger

Python Standardbibliothek Meisterschaft 3 - pathlib

Gleicher Name, andere Ergebnisse: So nutzen Sie urlencode in Django-Projekten korrekt

Hinterlasse einen Kommentar

Fügen Sie einen neuen Kommentar hinzu

1. Warum mit `collections` anfangen?

2. `Counter` – Die klassische Frequenzzählung und mehr

📌 `most_common(n)` – gibt die n häufigsten Elemente zurück

📌 `elements()` – ein Iterator, der jedes Element so oft wiederholt, wie es seinem Auftreten entspricht