07 Avancerad analys och Big Data Flashcards

1
Q

Vad är en analysapplikation?

- Henry Morris (3)

A

Fristående från operationella system/källor

Sammanför data från flera källor och möjliggör analys
över tid

Kan automatisera uppgifter för att optimera vissa
affärsprocesser (ge direkt affärsnytta)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vad är Big Data? (3+2)

A

Definierat som åtminstone något av:

  • enormt stora, snabbt inflödande, multistrukturerade
    (eng. volume, velocity, variety)
  • värdeskapande och korrekta
    (eng. value, veracity)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vilka två generella lagringsformer finns för hantering av Big Data?

A

Relationsdatabashanterare/data warehouse

  • traditionella, men kraftfulla
  • för strukturerad data, dvs med fördefinierad datamodell

Hadoop
- även för ostrukturerad data, dvs text, video, bild, sensordata, strömmande data, webbdata, data från sociala media

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vilka två lager bestod Hadoop 1.0 utav?

A

Mapreduce
- framework/programmeringsskiktför datahantering och klusterhantering

HDFS
- Hadoop Distributed File System

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vilka tre lager bestod Hadoop 2.0 utav?

A

Mapreduce
- framework/programmeringsskikt för datahantering

YARN (Yet Another Resource Negotiator)
- tog över resurshanteringen för
klustren från MapReduce

HDFS (Hadoop Distributed File System)

  • består av ett antal noder ordnade i kluster
  • data ordnas i filer med pekare
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vad är en NoSQL-databas? (1+4)

A

En databas som inte bygger på relationsmodellen:

  • ingen SQL, ingen ACID
  • snabb datahantering viktigare än korrekthet till 100%
  • open source
  • skalbar horisontellt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vilka huvudtyper av NoSQL-databaser finns? (4)

A

(Wide) Column Store-DB (t ex HBase )

Document Store-DB (t ex MongoDB)

Key/Value Store-DB (t ex DynamoDB)

Graph Store-DB (t ex Neo4J)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vilka två typer av avancerad analys finns?

A

Data Mining och statistisk analys
- avancerad matematik på ”råa” (icke-aggregerade) datamängder, utförs av specialister, s.k. data scientists
– ofta på Big Data från data warehouse eller Hadoop- implementationer

Prediktiv analys (med hjälp av Data Mining)

  • skapar och testar modeller med hjälp av verklig data
  • för att förutse händelser och klassificera företeelser
  • trend att bygga in avancerad analys i existerande BI-plattformar för att öka tillgängligheten/användbarheten och därmed affärsnyttan
How well did you know this?
1
Not at all
2
3
4
5
Perfectly