Project Management Flashcards
Unterschied von Projektprogress in ML vs SE
Was sind Ursachen dafür, dass 87% der ML Projekte scheitern, bzw. 53% der ML Prototypen nicht die Produktion erreichen?
5
- Unklares Projektziel
- ML Ziel =!= Business Ziel
- Unkoordinierte Arbeite von DS vs SE
- Explodierende Kosten für Expertise und Hardware
- Komplexität des Projektes benötigt versch. Skills (SE, DevOps, Data Science, Data Engineer, …)
Was ist Hoftstadter’s Law?
It always takes longer than you expect, even when you take into account Hofstadter’s Law.
Nenne Gründe gegen AI Software
3
- Errors Costs > Improvement Costs
- Entscheidungen müssen erklärbar sein
- Entwicklung muss schnell gehen -> Starte mit Heuristiken
4 Gründe für Automatisierung
- Mehr Effizienz
- Mehr Sicherheit für Menschen
- Weniger langweilige Tasks
- Ermögliche Funktionalität, die Menschen ohne Automatisierung nicht beherrschen
4 Gründe für Augmentation (Zunahme)
- Höhere Kundezufriedenheit bei Aufgabe
- Mehr User Control
- Mehr Kundenverantwortung
- Mehr Kreativität
Definiere den Lebenszyklus eines ML-Projekts
(4)
Scoping & Planning < Data < Model < Deployment
Was gehört zu Scoping & Planning hinzu? (ML LC)
3
- Define Projekt Goals
- Specify Requirements
- Allocate Ressources
Model metric does not align with project goal; performance unsatisfiable/disappointing; requirements revisiting
Was gehört zu Data hinzu? (ML LC)
4
- Define and collect Data
- Preprocessing
- Label
- Organize Data
Data mismatch (different distribution in production); rare cases required; bias found
Was gehört zu Model hinzu? (ML LC)
5
- Model Selection
- Training
- Experimantation
- Error Analysis
- Debugging
*Production performance != training performance; non-functional properties not met; *
Was gehört zu Deployment hinzu? (ML LC)
3
- Deploy model
- monitor and maintain system
- feedback loop
Wie geht man an AI-Projekte heran?
Ziel: Budgetierung
4 + Budgetierung
Was sind Probleme an der folgenden Metrik für AI System “Credit Card Fraud”:
“Success the more unauthorized withdrawals we block”
2
- Bestes Outcome wird erreicht, wenn das System alle Transaktionen blockt
- Je mehr Transaktionen geblockt werden, desto mehr wird sich das herumsprechen, desto weniger Leute werden es bei der Orga versuchen -> Es wird angeblich schlechter über Zeit (bei Design)
Beschrifte die Achsen
Impact & Feasibility
Feasibility Pyramid for Cost Drivers + je 3 Beispielfragestellung
DMD
Difficulty
Availlability of Similar Solutions, Education, Ressource for Training, Deployment
Model Accuracy
Cost of wrong predictions, mininmum accuracy, retrain frequency
Data Availlability
Data aquiration, labeling and amount
Was sollte man bei der Datenverfügbarkeit und der Modellkomplexität beachten, wenn man über die Machbarkeitsanalyse nachdenkt?
Daten(2), Model(1)
- Wie schnelllebig sind die Daten?
- Zu welchen benötigten Informationen habe ich keinen Zugriff?
- Wie viel kostet ein Inferenzschritt?
Techniken für die Verbesserung der Machbarkeit
4
- keine 100% Accuracy Produktdesigns!
- Keine Abhängigkeit von einem einzigen Modell
- Sicherheitsmechanismen für KI-Nutzung (Anzeige bei guter Pseudo-Wahrscheinlichkeiten)
- Alpha-Test (Experimental)
Manage and Mitigate Risk
1. -> 2. -> 3.
1.Identify -> 2. Mitigate -> 3. Monitor
- Identifizierung
- Mildern / Reduzieren
- Beobachten
Was ist eine von Amazon erfunden gängige Methode für Riskmanagement?
Scoreboards in verschiedenen Kontexten:
z. B. :
- Project
- Finance
- Project Processes
- Data Quality
- Summary
Nenne die 3 Meilensteine um den Progress und Fokus für Entwicklungsstresspunkte im Auge zu behalten
- Domain Expertise
- Reproduziere Arbeit von anderen mit ähnlichen Zielen
- Automatisiere das Training und Inferenz Pipeline abgeleitet von 2.