Die Merkmalskonstruktion, auch Feature Engineering genannt, ist ein entscheidender Arbeitsschritt bei der Datenaufbereitung für das maschinelle Lernen, der die Leistung der Modelle stark beeinflusst. In diesem praxisnahen Buch lernen Sie Techniken, um Merkmale – numerische Repräsentationen eines bestimmten Aspekts von Rohdaten – zu gewinnen und mit maschinellen Lernmodellen nutzbar zu machen. Jedes Kapitel führt Sie durch eine spezifische Aufgabe der Datenanalyse wie etwa die Darstellung von Text- oder Bilddaten. Diese Beispiele veranschaulichen die wichtigsten Prinzipien der Merkmalskonstruktion.
Statt diese Prinzipien nur zu beschreiben, legen die Autorinnen Alice Zheng und Amanda Casari im gesamten Buch den Schwerpunkt auf die praktische Anwendung mit Übungen. Das Schlusskapitel vertieft das Gelernte, indem es verschiedene Techniken der Merkmalskonstruktion auf einen realen, strukturierten Datensatz anwendet. In den Beispielen werden Python-Pakete wie numpy, Pandas, scikit-learn und Matplotlib verwendet.
Aus dem
Merkmalskonstruktion an numerischen Filter, Klasseneinteilung, Skalierung, logarithmische und Potenz-TransformationenTechniken für natürlichen Bag-of-Words-Modelle, n-Gramme und PhrasenerkennungFrequenzfilterung und Merkmalsskalierung zum Entfernen aussageloser MerkmaleKodierungstechniken für Kategorievariablen, darunter Merkmals-Hashing und KlassenzählungModellgesteuerte Merkmalskonstruktion mit der HauptkomponentenanalyseDas Konzept der Modellkombination mit dem k-Means-Algorithmus als Technik zur MerkmalserzeugungGewinnung von Bildmerkmalen anhand manueller und Deep-Learning-Techniken
Alice is a technical leader in the field of machine learning. Her experience spans algorithm and platform development and applications. Currently, she is a Senior Manager in Amazon's Ad Platform. Previous roles include Director of Data Science at GraphLab/Dato/Turi, machine learning researcher at Microsoft Research, Redmond, and postdoctoral fellow at Carnegie Mellon University. She received a Ph.D. in Electrical Engineering and Computer science, and B.A. degrees in Computer Science in Mathematics, all from U.C. Berkeley.