Alteryx Week 120: Popular Baby Names

Task:

Das Ziel besteht darin, für jedes Jahr im Zeitraum von 1880 bis 2017 die jeweils beliebtesten registrierten Babynamen für Jungen und Mädchen zu ermitteln und deren Häufigkeit zu bestimmen.

Data:

Challenge_120_start_file.yxmd

  1. Data Input
    Einlesen der Ausgangsdaten.
  2. Text to Columns
    Die Inhalte der Spalte Field_1 werden anhand des Kommas in mehrere Spalten aufgeteilt. Es werden 3 Spalten erstellt.
  3. RegEx
    Extraktion des Jahres aus dem Dateinamen mithilfe eines Regular-Expression-Patterns (\d+).
  4. Select
    Entfernen nicht benötigter Spalten. Zusätzlich wird das Feld Frequency in den Datentyp Integer umgewandelt, um Berechnungen zu ermöglichen.
  5. Filter
    Aufteilung der Daten nach Geschlecht (Gender).
  6. Aggregation
    Gruppierung der Daten nach Year, Name und Gender sowie Summierung der Frequency.
  7. Sort
    Sortieren der Daten in absteigender Reihenfolge nach Frequency.
  8. Sample
    Pro Jahr wird jeweils nur der Datensatz mit der höchsten Frequency (Top N=1) beibehalten.
  9. Join
    Die Datensätze beider Geschlechter werden wieder zusammengeführt.
  10. Select & Sort
    Umbenennen der Spalten, Anpassen der Datentypen und abschließende Sortierung.
  11. Expect Equal
    Abgleich der Ergebnisse mit der bereitgestellten Referenzlösung.
Author:
Aschraf Aouina
Powered by The Information Lab
1st Floor, 25 Watling Street, London, EC4M 9BR
Subscribe
to our Newsletter
Get the lastest news about The Data School and application tips
Subscribe now
© 2026 The Information Lab