01-CDI Concepts and Architecture Flashcards
Cos’è IDMC? Cosa offre?
- Informatica Data Management Cloud: piattaforma unificata per gestire, governare e unificare i tuoi dati
- COSA OFFRE: opzioni di connettività
Che tipo di architettura ha IDMC?
Quali componenti la compongono?
- ARCHITETTURA: cloud-native
- COMPONENTI (implementati come microservizi):
- sicurezza
- controllo degli accessi
- servizi di repository
- altro (a seconda della licenza acquistata)
Come può essere configurato l’ambiente di esecuzione di IDMC?
- ambiente locale
- ambiente ospitato
- serverless
Cos’è CLAIRE? Cosa offre?
- CLAIRE: motore di intelligenza artificiale di Informatica
- COSA OFFRE:
- intelligenza unificata per i metadati aziendali
- dati alimentati dall’IA
- automazione intelligente dei metadati
Quali sono i moduli principali in IDMC?
- Administrator
- Data Integration
- Data Quality
- Application Integration
- Data Governance
- Master Data Management
Modulo ADMINISTRATOR
- raggruppa i servizi principali per AMMINISTRARE l’ambiente di IDMC
- COSA OFFRE:
- controllo degli accessi
- gestione degli ambienti di runtime e delle connessioni
- monitoraggio dell’ambiente e dei processi
Modulo DATA INTEGRATION
COMPRENDE I SERVIZI:
- CDI:
- sviluppo di task per integrazione/sincronizzazione dei dati
- costruire logiche di mapping complesse - MASS INGESTION:
- creazione di soluzioni flessibili/scalabili guidate da wizard per acquisire dati
- trasferimento dati da applicazioni, fonti di streaming, database e file in archivi cloud o servizi di messaggistica - CHANGE DATA CAPTURE: permette carichi incrementali basati sui cambiamenti nei sistemi di origine
Modulo DATA QUALITY
COSA OFFRE:
1. esecuzione di profili per analizzare/validare dati rispetto a regole aziendali
2. pulizia e standardizzazione basate su regole o dizionari possono essere applicate nei profili o nei mapping di integrazione dei dati
Modulo APPLICATION INTEGRATION
COSA OFFRE:
integrazione in tempo reale basata su API tra partner e clienti
Modulo DATA GOVERNANCE
COSA OFFRE:
consente al cliente di catalogare e gestire i propri asset aziendali e tecnici, gestendo la proprietà e gli stakeholder degli asset di dati
Modulo MASTER DATA MANAGEMENT
COSA OFFRE:
riguarda la creazione di un record principale unico per
1. ogni persona, luogo o elemento in un’azienda
2. proveniente da fonti di dati e applicazioni interne ed esterne
3. al fine di creare una visione affidabile dei dati critici per il business
Dove vengono eseguiti i servizi IDMC?
Nel cloud, su AWS, Azure e GCP
Dove sono contenuti gli asset dei clienti?
Nel REPOSITORY dei METADATI
Cosa possono utilizzare per accedere all’ambiente gli utenti?
- HTTPS
- user ID
- password
A cosa serve e qual è l’AMBIENTE DI RUNTIME più comune?
- SCOPO: eseguire mapping e taskflow
- PIU’ COMUNE: secure agent cloud
Come funziona il SECURE AGENT CLOUD?
- funziona dietro firewall del cliente
- possono essere raggruppati in un GRUPPO di secure agent
- accesso agli asset di dati cloud simile a quello con secure agent locale
Quali categorie di CONNESSIONI esistono?
- FILE FLAT: FTP, SFTP, S3
- DATABASE: driver nativi, JDBC, ODBC
- DATABASE CLOUD & DATA LAKE: Snowflake, Amazon RDS, Azure DW
- APPLICAZIONI: SAP
- SERVIZI WEB
Cos’è possibile utilizzare se il cliente dispone della licenza Cloud Runtime?
Hosted Agent
Come agire nel caso fosse necessario accedere ad applicazioni locali?
- configurare le regole del firewall per l’Hosted Agent
- o installare un Secure Agent all’interno della rete del cliente
Cosa può essere eseguito in un ambiente ADVANCED SERVERLESS?
- CDI Elastic
- Advanced Integration
Quali tipi di TASK esistono?
- REPLICA, SINCRONIZZAZIONE E TRASFERIMENTO DATI
- MASKING:
- consente di mascherare campi sensibili nella sorgente per creare dati di test identificati a partire da dati di produzione reali - MAPPING:
- impostare ambiente di esecuzione, parametri di runtime e altre impostazioni avanzate, come le PROPRIETA’ SPARK per i mapping creati in modalità avanzata
- attività di mapping dinamico consentono di creare/raggruppare più processi basati sullo stesso mapping
Di base, da cosa è formata una MAPPATURA? Quali possibilità esistono al di fuori di questa?
- BASE: 1 sola sorgente, 1 solo target, 0 trasformazioni intermedie
- 1 o + sorgenti, 1 o + target, trasformazioni intermedie
- sorgenti possono essere di più tipi
- anche target
- vasta lista trasformazioni (più comuni: espressioni, lookup, joiner)
A cosa servono le MAPPING TASKS?
- impostare l’ambiente di runtime
- definire notifiche email in caso di successo o errore
- aggiungere script per il preprocessing e il postprocessing
Quali tipi esistono e come funzionano i TASKFLOW?
- combinano uno o più task in un flusso di processo
- i task possono essere di diversi tipi:
- mapping tasks
- assegnazioni
- attese di file
- comandi - puoi disporre i task nel taskflow in modo sequenziale o in parallelo