Specialization IB - question 4 (Probability) Flashcards

Question

Cumulative distribution - Binomial

Answer 1

k=1 ... |t| ∑ ( n over k ) * p^(k) * (1-p)^(n - k)

Answer 2

Nema PMF - ale density function (hustota pravdepodobnosti) F(x) = from -inf .. x ∫︀ f_X (t) dt

Answer 3

p_(X, Y) = P(X=x && Y=y) another formula: p_(X, Y) = P(Y=y | X=x)*P(X=x) = P(X=x|Y=y)*P(Y=y) je v rozmezi [0, 1]

Answer 4

* uniformi - rovnomerne * normalove - napr. distribuce IQ * Exponencionalni

Answer 5

je to vektor nahodnych velicin (X_1, ... , X_r) nejcasteji pro dve veliciny na porovnani

Answer 6

Ocekavana hodnota. Pro uniformni hodnoty prumer E(X) = ︁∑ x * P(x) ; x ∈ Im(X)

Answer 7

E(X) = ∑ (x*1)/n = ( ∑ x ) / n

Answer 8

E(X) = 0 * (1-p) + 1*p = p

Answer 9

E(X) = 1/p

Answer 10

E(X) = 1/p

Answer 11

* Linearita 1. E(c * X) = c * E(X) 2. E(X + Y) = E(X) + E(Y) * Jestli X, Y nezavisle -> E(X * Y) = E(X)*E(Y) * Podminena stredni hodnota: X, Y diskretni nahodne veliciny. 1. E(X|Y=y) = ∑ x * P( X=x | Y=y ) * Markov inequality (Markova nerovnost) - X je non-negative nahodna velicina s konecnou stredni hodnotou. Potom plati pro vsechny t > 0: P(X ≥ t) ≤ E(X) / t Markov inequality stanovuje upper bound probablity na bazi stredni hodnoty.

Answer 12

second central moment VAR(X) = E([X- E(X)] ^2) = ∑ (x - E(x))^2

Answer 13

collection of random variable { X_t | t ∈T } * T = cas * X_t = stav X v case t sekvence epxerimentuje, ktere sleduji vyvoj v case (napr. teplota CPU, vyvoj populace) - bereme jenom hodnoty v diskretnim case (mereni v casovych bodech - treba jednou za hodinu)

Answer 14

Jsou stochasticke procesy takove: P(X_(t+1) = a | X_t = b) neboli budouci hodnota zavisi pouze na aktualni hodnote Da se rict, ze vyjadruji pravdepodobnost prechodu do dalsiho stavu - ergo daji se reprezentovat automatem, matici (transition matrix). napr. Ze stavu 'A' muze prejit do stavu 'B', 'C', 'D' avsak pravdepodobnosti vsech prechodu z 'A' se musi rovnat 1 (100%). Tedy P('A', 'B') + P('A', 'C') + P('A', 'D') + P('A', 'A') = 1 Pouziti v NLP napr. mame vety, analyzujem posloupnout a stvorime automat: Zacina: slovem I, nasledne treba 30% don't, 70% like a tak

Answer 15

H (X) = - ∑ p_X(x)*log p_X(x) ; p_X(x) je pravdepodobnostni funkce Entropie 0 = vime, co se stane Nejvetsi entropii ma uniformni distribuci Vyjadruje se v bitech (informace). Stanovuje nejmensi ocekavany pocet bitu na preneseni dane informace (ocekavane - stredni hodnota vpodstate) log_b = b - base, volime dle jednotky ... log_2 pro bity. log_8 pro bytes treba H(1/(mn), ...) = H(1/m, ...) + H(1/n, ...); m a n jsou nezavisle

Answer 16

Casto pouzite pro loosless kompresi dat funguje, ze nejcasteji vyskytujicimu prvku se da nejkratsi kodove slovo (0) a naopak - prvku x z X kde x ma nejmensi pravdepodobnost, tak x ma nejdelsi slovo. a_1 = 1/2 ... 0 a_2 = 1/4 ... 10 a_3 = 1/8 ... 110 a_4 = 1/8 ... 111

Answer 17

R = { log_2{M} } / n # (bitu pro prenos - throughput) Kapacita kanalu: C = max I(X; Y) = max [H(Y ) − H(Y | X )] kde * nahodna velicina X je vstup * nahodna velicina Y je vystup

Answer 18

SQRT( VAR(X) ) // rozptyl je vypocitany jako jednotka^2 .. napr m^2

Answer 19

* VAR(aX + b) = a^2 * VAR( X ) * VAR(X) = E(X^2) - E(X)^2

Answer 20

COV(X, Y) = E[X -E(X)] * E [Y - E(Y) ] meri linearni zavislost * Cov < 0 = anticorrelated * Cov = 0 neutralni linearni zavisle * Cov > 0 - linearne zavisle

Answer 21

Cim delsi sekvence nezavislych nahodnych velicin (experimentu), tim bliz se dostavame ke stredni hodnote (strong law of large numbers)

Answer 22

P(|X - E(X)| ≥ t) ≤ VAR(X) / t^2 - stanovuje uper bound na rozptylu

Answer 23

Zatimco Markov chain diskretni je v periodickych casech, continous specifikuje libovolne mnozstvi casu nez nastane prechod

Answer 24

entropie paru (n-tice) X,Y - jsou korelovatelne H (X, Y) = - ∑_x ∑_y { p(x, y)*log p(x, y) }

Answer 25

Mira nejistoty (H(X|Y)) hodnoty X za predpokladu, ze je dana hodnota Y H(X|Y) = 0 jestli X je kompletne zavisle na Y H(X|Y) = H(X) jestli X a Y jsou nezavisle H (X|Y) = - ∑ P(X=x | Y=y)*log{ P(X=x | Y=y) }

Answer 26

H(X_1, X_2, ... X_n) = H(X_1) + H(X_2|X_1) + .. + H( X_n | X_1 ) Podobne: D(p(x, y ) || q(x, y )) = D( p(x) || q(x)) + D( p(y|x) || q(y|x)) H(X , Y) = H(Y) + H(X|Y)

Answer 27

Circle A = H(X) Circle B = H(Y) cast A and B (prunik) = I(X; Y) dohromady A a B (union) = H(X, Y) H(X|Y) = H(X) - I(X;Y) H(Y|X) = H(Y) - I(X;Y)

Answer 28

Vyjadruje, jak se pravdepodobnosti rozlozeni p lisi od pravdepodobnostniho rozlozeni q D(p || q) = - ∑ p(x) * log ( p(x) / q(x) )

Answer 29

Meri mnozstvi informaci, ktere veliciny X a Y maji spolecne I(X; Y) = 0 - nezavisle I(X; Y) = ∑ p(x, y) log { p(x, y) / ( p(x) * p(y) ) } I(X;Y) = H(X) + H(Y) - H(X,Y)

Answer 30

I(X;Y|Z)=H(X|Z) - H(X|Y, Z) Venn diagram: cast, ktera je spolecna pouze X a Y

Answer 31

Mame kod (M, X^n, g) * M = pocet kodovych slov * f = enkodovaci funkce f: X^n: {1, 2, 3, ..., M} -> X^n * g = dekodovaci funkce g: Y^n -> {1, 2, 3, ..., M} Kanal je pak definov (X, p(y|x), Y) * X je vstupni abeceda * p(y|x) je pravdepodobnostni funkce * Y je vystupni abeceda λ_i = SUM_{y^n takovych, ze g(y^n) != i } { p( y^n | x^n ) } max prob of error λ_max = max λ_i

Answer 32

Kanal je pak definov (X, p(y|x), Y) * X je vstupni abeceda * p(y|x) je pravdepodobnostni funkce * Y je vystupni abeceda mapovani: 0 -> 0: 1-p 0 -> 1: p 1 -> 0: p 1 -> 1: 1-p neb ze pravdepodobnosti, ze se bit prenese spravne jsou stejne.

Answer 33

Bez pameti: zavislost vystupu zalezi ciste na aktualnim vstupu p( y_k | x^k)

Specialization IB - question 4 (Probability) Flashcards

(58 cards)