11 Web Data Mining Flashcards

1
Q

Varför utförs Web Data Mining och vad är det?

A
  1. Internet har mer information än något annat ställe

2. Handlar om att utvinna data och finna mönster i data från webben

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vilka tre typer av Web Data Mining finns?

A

Web Content Mining
- innehåll av webbsidor/mail

Web Structure Mining
- hyperlänkar mellan dokument

Web Usage Mining
- användardata, klickströmmar etc

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vad innebär Web Content Mining?

A

Hitta mönster i innehållet av webbsidor, e-mail etc
- foton, illustrationer, videor, tal etc

Störst fokus på text
- ofta väldigt dålig kvalitet

–> handlar om Text Mining

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

På vilka två sätt kan man hitta mönster i text (text mining)? (1+2)

A

Genom maskininlärning

Unsupervised learning
- klustring (inga fördefinierade kategorier)

Supervised learning
– vi lär oss genom förkategoriserade kategorier med exempel (postiv/negativ recension)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vad innebär “named entities” kopplat till text?

A

Namn på personer, företag, geografiska platser etc

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vad kan vi använda de mönstren som hittas genom Web Content Mining? (4)

A

Riktad marknadsföring
- vilken sida?

Läkemedelsinteraktioner
- kolla forum där folk pratar om dem

Opinion mining dokumentnivå

  • vem är mest populära presidentkandidaten?
  • attityd mot våra/konkurrenters produkter?

Opinion mining meningsnivå

  • gå in på delar av texten
  • produkts fördel/nackdel i en och samma kommentar
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vad innebär Web Structure Mining?

A

Strukturer mellan dokument

  • bygger på teorier om social nätverksanalys
  • sociala entiteter (aktörer) och deras interaktioner och relationer

Vi kan genom mining av dessa hitta roller, positioner
- ex prestigefyllda webbsidor

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Varför är Web Structure Mining användbart?

A

Webben är en social aktör - varje sida är en social aktör

- varje hyperlink är en relation (tie)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Vad är ties och vilka typer finns? (1+2)

A

Hyperlänkar (relationer)

Ties sent
- utlänkar

Ties received
- inlänkar

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hur bedöms en aktörs prestige inom Web Structure Mining?

A

Räkna inlänkar:

  • varje inlänk är en röst
  • inkommande länkar från andra prestigefyllda sidor väger högra (spamfilter)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vad används Web Structure Mining till? (4)

A

Ranka webbsidor (Google sökmotor)

Räkna ut hur ofta man behöver besöka en hemsida för indexering

Gruppera användare i sociala nätverk, rekommendera vänner etc

Analysera ett företags struktur genom att titta på de interna mailkonversationerna

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vad innebär Web Usage Mining?

A

Hur dokument faktiskt används - hur användare agerar med dessa

Försöker upptäcka mönster i tex klickströmmar

MÅL:
Hitta beteendemönster och skapa användargrupper baserat på detta

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vilka källor används för att utföra till Web Usage Mining? (3)

A

Webbserver-loggar
- på hemsidor

Applikationsserver-loggar
- inne i program

Sökfrågor
- när användare söker data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vilka typiska fält används i vid Web Usage Mining? (4)

A

Tid
Datum
IP-adress
Cookies (tidigare besökta sidor etc)

osv

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vad används Web Usage Mining till? (5)

A

Marknadsföring

Personaliserat innehåll

Online-rekommendationer

Förbättra webbplatsers struktur

Utvärdera marknadsföringskampanjer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Vad innebär syntax? (web content/text mining)

A

Veta vad som är subjekt och vad som är objekt i en mening

17
Q

Vad innebär semantik? (web content/text mining)

A

Veta att “hund” och “vovve” refererar till samma koncept

18
Q

Vad innebär morfologi? (web content/text mining)

A

Veta att “hund” och “hundarnas” refererar till samma koncept