Les 2 - Tentamenstof Flashcards
Wat betekent de confidence na datamining?
De betrouwbaarheid van de kans op de relatie, dus hoe groot de kans is. tussen 0 en 1.
Wat betekent de lift na datamining?
De lift houdt in hoeveel sneller je was met het bepalen/voorspellen. Bij de berekeningen zou dat inhouden dat je 2x zo snel de relatie legt dan een regulier algoritme met het doorlopen van resultaten.
Wat houdt de market-basket model in?
Is een affiniteit analyse, dit houdt in dat artikelen vergeleken worden met baskets. Daarmee kan bepaald worden wat voor iemand interessant is. (veel op veel) basket > kleine set items, items > veel baskets
Wat houdt frequent itemsets in?
aantal op basis van hoe vaak alle items voorkomen in een basket.
Wat houdt associatie regels in?
een associatie met een product A in een basket, dat product B dan ook interessant is, op basis van de confidence.
Wat is de A-Priori algoritme?
twee keer de baskets analyseren. Dit wordt gedaan door eerst de items te tellen en te bepalen welke frequent zijn. Vervolgens worden alleen de item pairs geassocieerd als ze frequent bevonden zijn in de eerste analyse.
Geef een voorbeeld van een Python set
a = {1, 2, 3}
Geef een voorbeeld van een Python list
a = [1, 2, 3]
Geef een voorbeeld van een python dictionary
dict = {‘Name’: ‘Zara’, ‘Age’: 7, ‘Class’: ‘First’}
Hoe bereken je de support?
Door te tellen hoe vaak alle items in itemset A voorkomen in de baskets. Meestal in en percentage uitgedrukt.
Hoe bereken je een frequent item set?
Door een grenswaarde te bepalen van de support, en dan de item sets te vinden die vaker voorkomen in de baskets dan je grenswaarde.