egzamin kierunkowy Flashcards
W jaki sposób zjawiska społeczne wpływają na rozwój technologiczny i same ulegają wpływom technologicznym?
instrumentalizm: technologia jako narzędzie, jest czymś neutralnym i jedynie pomaga w wykonywaniu działań
determinizm technologiczny: technologia jest sprawcą zmian i wywiera wpływ na społeczeństwo przekształcając je w jakiś sposób (np.: rewolucja przemysłowa)
konstruktywizm: technologia to społeczny wytwór, społeczeństwo wpływa na jej rozwój (np.: transport samochodowy w Ameryce)
teoria aktora-sieci: technologia i społeczeństwo jako jeden układ, są nierozerwalne
Co to jest innowacja? Czym różni się od inwencji? Jakie są rodzaje innowacji?
innowacja: proces wprowadzania nowych pomysłów na rynek, które wprowadzają ulepszenia w danym obszarze, wdrożenie inwencji i jej komercjalizacja
inwencja: akt tworzenia nowych pomysłów i koncepcji
innowacje radykalne oraz inkrementalne
rodzaje innowacji:
- produktowa (smartfon)
- procesowa (automatyzacja produkcji)
- marketingowe (subskrypcje>lifetime access)
- organizacyjne (4 dni pracy)
- społeczne (torby zakupowe na wózki inwalidzkie)
Czym jest design thinking? Z jakich etapów się składa? Do czego służy?
design thinking: iteracyjny proces rozwiązywania problemów skupiający się na zrozumieniu potrzeb użytkowników oraz empatyzacji. Służy do rozwiązywania złożonych problemów w innowacyjny, user-centered sposób
etapy:
- empatyzacja
- definiowanie problemu
- generowanie pomysłów
- prototypowanie
- testowanie
Na czym polega empatyzacja w podejściu design thinking? Przy pomocy jakich metod się ją realizuje?
empatyzacja polega na głębokim zrozumieniu potrzeb, pragnień, frustracji i zachowań użytkowników. Pozwala na wgląd w rzeczywiste doświadczenia użytkownika aby zidentyfikować problemy
metody:
- wywiady
- obserwacja
- shadowing
- dzienniki użytkowników
- mapowanie empatii
- persony
- fokusy
Na czym polega specyfika podejścia design thinking w tworzeniu i rozwijaniu pomysłów? Jaką rolę pełnią prototypy?
specyfika to iteracja, interdyscyplinarność zespołów oraz ilość generowanych pomysłów
prototypy pozwalają na szybkie i tanie testowanie pomysłów w praktyce, na wczesnym etapie. Pozwalają na wizualizacje pomysłów, eksperymentowanie, zaangażowanie interesariuszy, redukcję ryzyka oraz stymulację kreatywności
Czym metody jakościowe badań społecznych różnią się od metod ilościowych? Od czego zależy wybór konkretnej metody badań?
badania jakościowe
jak osoby korzystają z X, dlaczego, jakie mają motywacje i potrzeby
badania jakościowe wyjaśniają motywy postępowania
- rozpoznanie nowego rynku
- zrozumienie badanego zjawiska
- wykrycie motywacji i przekonań klientów
badania ilościowe
Ile osób w populacji rozpoznaje X, używa Y, korzysta, posiada Z
najczęściej prowadzone na dużych próbach (reprezentatywne). Korzystają z metod statystycznych
- określenie udziałów rynkowych
- określenie popytu
- określenie częstotliwości występowania zjawiska
Jakie znasz techniki badawcze w zakresie metod jakościowych badań społecznych? Do czego się je stosuje? Jakie są ich wady i zalety?
metody badań:
1. wywiady IDI
zgłębienie tematyki i znalezienie obszarów, do których wcześniej nie mogliśmy dotrzeć
+głębokie zrozumienie, elastyczne
-niereprezentatywne, czasochłonne
2. badania fokusowe
badania marketingowe, badania rynku, opinii, ewaluacje
+dają dużo informacji, perspektyw
-silne osobowości, presja, ograniczony czas
3. obserwacja uczestnicząca
badanie społeczności
+naturalne środowisko, weryfikacja informacji, autentyczność danych
-czasochłonność, subiektywność, nie da się obserwować wszystkiego
4. studium przypadku
zobrazowanie zjawiska, często nietypowego
+dużo informacji, głębokie zrozumienie
-niereprezentatywne, subiektywność lub błędna interpretacja
Na czym polega dobór w badaniach społecznych? Czym się różni w zależności od metody badawczej?
metody jakościowe
próbkowanie celowe, wybieranie uczestników na podstawie istotnych kryteriów
- kryterialne
- typowe
- ekstremalne lub odmienne przypadki
- teoretyczne
metody ilościowe
próbkowanie losowe zapewnienia reprezentatywność
- losowe
- systematyczne losowe (co n-ty)
- warstwowe losowe
- zespołowe
Czym jest audyt użyteczności? W jakim celu się go robi, na jakim etapie? Jakie można wyróżnić jego typy? Czym te typy różnią się od siebie. Wg jakich wytycznych przeprowadza się audyt dot. heurystyk? Wymień znane ci heurystyki, jak mogą być one odzwierciedlone na stronach? Kto przeprowadza audyt?
audyt użyteczności: proces oceny interakcji użytkownika z produktem w celu zweryfikowania problemów i poprawy doświadczeń użytkownika
metody analizy: heurystyczna, wędrówka poznawcza, lista kontrolna
wytyczne audytu dot. heurystyk:
10 heurystyk Nielsena
1. Widoczność stanu systemu (informowanie użytkownika co się dzieje)
2. Dopasowanie systemu do świata rzeczywistego (mówienie językiem użytkownika)
3. Kontrola i swoboda (wyraźna droga wyjścia)
4. Spójność i standardy (standardy branżowe)
5. Zapobieganie błędom
6. Rozpoznawanie zamiast przypominania (minimalizacja obciążenia pamięci użytkownika)
7. Elastyczność i efektywność (dla początkujących i zaawansowanych)
8. Estetyka i minimalizm
9. Pomoc w błędach (jasne komunikaty o błędach)
10. Pomoc i dokumentacje (łatwość znalezienia)
audyt przeprowadza zespół projektowy, specjaliści ds. użyteczności
Na czym polega proces dobierania uczestników do badań użyteczności? Jaka jest optymalna liczba respondentów w badaniu użyteczności? Dlaczego? Na jakiej podstawie dobierać respondentów do badań użyteczności? Jakie narzędzie może w tym pomóc?
proces dobierania uczestników:
1. określenie kryteriów
2. rekrutacja uczestników
3. selekcja uczestników
optymalna liczba uczestników: 5 (wykrywa ok . 85% problemów)
na jakiej podstawie dobierać respondentów?
- dane demograficzne
- doświadczenie użytkownika
- specyficzne cechy
narzędziem, które może pomóc jest ankieta wstępna/formularz rejestracyjny/screener
Czym są badania korytarzowe? Jakie są zalety i wady takiego badania?
badania korytarzowe: metoda badawcza polegająca na obserwacji zachowań lub reakcji osób w naturalnym środowisku. Krótkie spotkania w nieformalnym i spontanicznym kontekście
+niski koszt, bez przygotowania, wstępny feedback
-niereprezentatywne, niezbyt dogłębny feedback
Czym są badania potrzeb?
badania potrzeb: proces zbierania, analizowania i interpretacji danych zebranych na temat potrzeb, oczekiwań użytkowników. Pozwalają lepiej zrozumiec oczekiwania grupy docelowej
metody: wywiady, fokusy, ankiety, co-creation, obserwacje, badania dzienniczkowe
Jakie są techniki badawcze, które można dobierać na etapie ewaluacji?
ewaluacja: ocena efektywności i jakości rozwiązania
- ankiety i kwestionariusze
- testy użyteczności
- eye-tracking
Opisz znane ci formy i miary informacji
miary informacji
- entropia: miara niepewności, “niespodziewalności” danych
- informacja wspólna/wzajemna: miara ilości informacji, którą jedna zmienna zawiera o innej
- redundancja: część informacji, która nie wnosi nowej wiedzy, mierzy nadmiarowość informacji w zbiorze
formy informacji
(parametryczna, topologiczna, abstrakcyjna)
- tekstowa
- dźwiękowa
- wideo
- obrazowa
- numeryczna
Wyjaśnij pojęcia kryteriów informacyjnych (Bayesa, entropii, informacji wspólnej)
kryterium informacyjne: narzędzie używane do wyboru najlepszego modelu spośród zestawu modeli
- kryterium informacyjne Bayesa
BIC=kln(n)-2ln(L)
k: liczba parametrów, n: liczba obserwacji, L: maksymalna wartość funkcji wiarygodności modelu - entropia
H(X)=-sumP(xi)log2P(xi) - informacja wspólna
I(X;Y)=H(X)+H(Y)-H(X,Y)
Opisz struktury i architekturę logiczną systemów komputerowych
struktura systemu komputerowego:
1. warstwa sprzętowa
2. oprogramowanie systemowe
3. oprogramowanie narzędziowe (wspomagające oprogramowanie)
4. oprogramowanie użytkowe
5. użytkownicy
architektura logiczna:
1. liczbowy system binarny
2. bramki logiczne (budują układy)
3. podział systemu na komponenty
Wyjaśnij pojęcie sieci komputerowej. Z jakich komponentów się składa?
sieć komputerowa: grupa komputerów lub innych urządzeń podłączonych ze sobą w celu wymiany danych lub dzielenia zasobów
komponenty:
- serwer sieciowy
- komputery
- media transmisji
- osprzęt sieciowy
- zasoby sieciowe
- oprogramowanie sieciowe
Jakie są rodzaje sieci komputerowych?
LAN: niewielki obszar, firmy, szkoły (przewodowa i bezprzewodowa)
WAN: rozległa, kraj, kontynent, droga infrastruktura
WLAN: bezprzewodowa, domy, kawiarnie, wymaga punktów dostępowych
MAN: tereny miast, metropolii, monitoring, połączenia między budynkami
VPN: prywatną sieć, połączenie prywatne przez sieć publiczną, łączenie oddziałów firm
PAN: osobista sieć, bluetooth, NFC
CAN: sieć kampusowa
Wymień atrybuty jakości systemów informatycznych
- Funkcjonalność - spełnia wymagania i funkcjonalności
- Użyteczność - wydajnie osiąga cele
- Niezawodność - wykonuje swoje funkcje
- Przenośność - inny sprzęt/oprogramowanie
- Kompatybilność - działanie z innymi systemami
- Bezpieczeństwo - ochrona informacji
- Utrzymywalność - łatwość modyfikacji, ulepszenia
Czym się różni grafika wektorowa i rastrowa? Wymień zalety i wady każdej z nich
grafika wektorowa
SVG, AI, PDF
składa się z geometrycznych obiektów definiowanych równaniami
+bezstratna kompresja, dobra do logo, ikon
-słaba do fotografii, może wymagać oprogramowania, nieodpowiednia dla skomplikowanych tekstur
grafika rastrowa
JPEG, PNG, GIF, BMP, TIFF
składa się z siatki pikseli o konkretnych wartościach koloru
+doskonała do zdjęć, umożliwia edycję kolorów
-stratna kompresja, duże pliki
Wymień i opisz podstawowe formaty plików graficznych
- JPEG: stratna kompresja, dobry do zdjęć, nie obsługuje animacji
- PNG: bezstratna kompresja, obsługuje kanał alfa, dobra do grafiki internetowej
- GIF: obsługuje kanał alfa, animacje, ograniczona liczba kolorów
- BMP: bitmapa, MS Paint, proste grafiki
- SVG: format oparty o XML, grafiki wektorowe
- AI: Adobe Illustrator, profesjonalne grafiki
Co to jest algorytm i jakie powinien posiadać cechy? Wskaż jak wyrażana jest złożoność obliczeniowa algorytmu
algorytm: zbiór dobrze zdefiniowanych instrukcji do wykonania określonego zadania i rozwiązania problemy
cechy:
- jednoznaczność (taki sam wynik dla takiego samego zbioru)
- skończoność (dokładnie i w skończonym czasie)
- efektywność (jak najmniejsza ilość skończonych kroków)
- poprawność (zwraca poprawne wyniki)
złożoność obliczeniowa: analiza czasu i pamięci potrzebna do wykonania zadania z zależności od wielkości danych
notacja Big O, O(n) gdzie n to wielkość danych
Na czym polega analiza częstotliwościowa sygnałów?
analiza częstotliwościowa sygnałów: badanie składowych częstotliwości sygnału
narzędzie - Transformata Fouriera, przekształca sygnał z dziedziny czasu na dziedzinę częstotliwości
W wyniku transformaty otrzymujemy widmo częstotliwościowe (jakie i jak mocno) i fazowe (zmiany faz sygnału)
kroki:
- przygotowanie sygnału
- transformata
- analiza widma
- interpretacja
Jakie znasz metody redukcji szumu w obrazach? Opisz wybraną metodę
- filtr medianowy: zastąpienie pikseli przez medianę wartości pikseli wokół nich (maska 3x3). Skuteczne dla pojedynczych wartości, mało skuteczne przy krawędziach obrazu
- filtr uśredniający
- filtr Weinera
- filtr Gaussa
- CNN i GAN
- dyfuzja anizotropowa
- progowanie falkowe
Jakie znasz metody redukcji szumu w obrazach? Opisz wybraną metodę
- filtr medianowy: zastąpienie pikseli przez medianę wartości pikseli wokół nich (maska 3x3). Skuteczne dla pojedynczych wartości, mało skuteczne przy krawędziach obrazu
- filtr uśredniający
- filtr Weinera
- filtr Gaussa
- CNN i GAN
- dyfuzja anizotropowa
- progowanie falkowe
Wymień metody składowania i przetwarzania wiedzy semantycznej
wiedza semantyczna: informacje opisujące znaczenie i relacje między danymi
metody składowania i przetwarzania:
1. ontologie: formalne struktury danych: pojęcia, relacje i atrybuty, reprezentują semantykę i relacje informacji
2. RDF: język danych (podmiot, predykat, obiekt)
3. SPARQL: język zapytań dla danych RDF
4. inferencja semantyczna: proces wnioskowania i wyciągania nowej wiedzy na podstawie istniejącej i reguł semantycznych
5. semantyczne wyszukanie: zrozumienie intencji użytkownika i kontekstu zapytania
6. semantyczne bazy danych: bazy odzwierciedlające semantykę informacji
7. systemy ramowe: grupowanie informacji w ramy (atrybuty i wartości)
Podaj zastosowania technologii semantycznych
- wyszukiwarki internetowe: analiza znaczenia zapytań użytkowników
- przetwarzanie języka naturalnego: tłumaczenie maszynowe, analiza sentymentu
- rekomendacje personalizowane
- analiza danych i przetwarzanie informacji
- IoT: wspomaganie komunikacji między urządzeniami
- e-commerce: dostosowanie produktów
Do czego w programowaniu służy funkcja i jaka jest ogólna składnia definiowania funkcji w językach programowania?
funkcja: blok kodu, grupuje powtarzający się kod, może być wywoływana w dowolnym miejscu kodu
nazwa(argumenty):
ciało
return wartość
lub
lambda x,y: x+y
Do czego w programowaniu służą instrukcje sterujące? Proszę opisać różnego typu instrukcje sterujące
instrukcje sterujące: kierują przepływem kodu
- instrukcje warunkowe: if, else, elif
- pętle: while, for
- instrukcje skoku: continue, break, return,
- instrukcje przełączania: switch
Na czym polega programowanie obiektowe i jakie są podstawowe cechy charakterystyczne programowania obiektowego
programowanie obiektowe: podejście oparte na koncepcji klas i obiektów
cechy:
- abstrakcja (ukrywanie szczegółów implementacji)
- hermetyzacja (ukrywanie danych i metod, metody publiczne)
- dziedziczenie (tworzenie hierarchii klas)
- polimorfizm (te same metody, różne obiekty, różne reakcje)
Do czego w programowaniu służą zmienne i operatory? Czym się różni operator przypisania od operatora porównania? Na czym polega przeciążanie operatorów?
zmienne: kontenery na dane, mogą być modyfikowane i używane w trakcie działania programu
operatory: specjalne symbole, słowa kluczowe, które wykonują konkretną operację matematyczyna lub logiczną
operator przypisania: przypisuje wartość zmiennej, zwraca wartość logiczną, np.: x=10
operator porównania: sprawdza czy wartości są równe, np.: if x==10:
return “ok”
przeciążanie operatorów
nadawanie operatorom nowego znaczenia w kontekście danych lub klasy
Do czego w programowaniu używa się struktur danych? Wymień i porównaj podstawowe struktury danych (np.: dostępne w języku Python)
struktury danych: przechowują, organizują i manipulują danymi
1. listy [1, 2, “trzy”] - rozszerzalne, sortowane, dodawanie i usuwanie elementów, odwoływanie się do wartości po indeksie
2. krotki (1, 2, 3) - nie można modyfikować elementów, indeksowane
3. słowniki {klucz: wartość} - przechowują pary klucz-wartość gdzie klucze są unikalne
4. zbiory {1, 2, 3} - unikalne elementy, nieindeksowane, brak kolejności elementów
Jak działają podstawowe algorytmy sortowania? Wymień przykładowe algorytmy i opisz dokładniej działanie jednego z nich
algorytmy sortowania: służą do uporządkowania elementów w określonym porządku
1. merge sort: rekurencyjnie dzieli listę na pół sortując połówki i scalając, O(NlogN)
2. insertion sort: dzieli listę na 2 i wstawia nieposortowane elementy między posortowane elementy, O(N²)
3. selection sort: znajduje najmniejszy element i zamienia go z pierwszym nieposortowanym i powtarza proces, O(N²)
4. bubble sort: porównuje sąsiednie elementy i zamienia je miejscami jeśli są w niewłaściwej kolejności . Jest stabilny, zachowuje kolejność równych elementów, O(N²)
Regresja liniowa, korelacja, kowariancja - podaj definicje i zastosowania
-
regresja: liniowa zależność między zmiennymi, przewiduje wartość zmiennej zależnej (dopasowuje prostą tak aby był jak najmniejszy błąd losowy)
przyjmuje postać: y=ax+b
- analiza trendów i prognozowanie
- analiza ryzyka w finansach
- analiza danych naukowych -
korelacja: związek między dwoma zmiennymi, stopień zależności
współczynnik korelacji Pearsona:
p=cov(X,Y)/sigmax*sigmay
p należy do [-1, 1]
- zależność raka i palenia
- marketing i analiza zachowań klientów
- medycyna i biologia
- uczenie maszynowe, redukcja cech -
kowariancja: miara wspólnej zmienności dwóch zmiennych
cov(X, Y) = E(XY) - E(X)E(Y)
- analiza rynku finansowego i ryzyka
- analiza danych eksperymentalnych
Na czym polega weryfikacja hipotez statystycznych?
hipoteza statystyczna: każde twierdzenie dotyczące populacji generalnej
hipotezy parametryczne (testy istotności)
hipotezy nieparametryczne (testy zgodności)
etapy testowania hipotez:
1. przyjęcie założeń, H0, H1
2. otrzymanie rozkładu, wybór testu
3. wyznaczenie poziomu istotności: określamy samodzielnie lub wg norm
4. przeprowadzenie badań
5. podjęcie decyzji na podstawie p
Wymień i omów rodzaje testów statystycznych
testy parametryczne: gdy dane spełniają założenia normalności
- test t-Studenta: porównuje średnie 2 grup
- test ANOVA: porównuje średnie 2+ grup
testy nieparametryczne: gdy szukamy rozkładu
- test X²: ocena zgodności wartości obserwowanych i oczekiwanych
- test Kruskalla-Wallisa: nieparametryczne ANOVA
- test Wilcoxona: weryfikuje wartość median
Na czym polega analiza wariancji i w jakim celu się ją stosuję?
analiza wariancji: porównanie wartości średnich 2+ grup
- równoliczne grupy
- równe wariancje
- rozkład normalny
porównanie wariancji zewnątrz do wewnątrzgrupowej
F=varbetween/varwithin
F nie może być < 1, dla F > 1 to dopiero sprawdzana jest istotność
Omów najważniejsze rozkłady prawdopodobieństwa (dyskretne i ciągłe)
dyskretne
- rozkład 0/1: zdarzenie wystąpi lub nie wystąpi (rzut monetą)
EX = p, D²X=p(1-p)
- rozkład równomierny: wszystkie wyniki mają jednakowe prawdopodobieństwo (losowanie liczby 0 do 9)
EX=(x1+xn)/2, D²X=(n²-1)/12 - rozkład Poissona: modelowanie liczby zdarzeń w przedziale czasu przy założeniu, że występują z określoną średnia częstością i są niezależne (liczba samochodów przejeżdżających most w ciągu 1h)
EX=lambda, D²X=lambda
ciągłe
- rozkład jednostajny: wszystkie wyniki w przedziale mają jednakowe prawdopodobieństwo (losowanie z przedziału [-1, 1])
EX=(a+b)/2, D²X=(b-a)²/12
- rozkład wykladniczy: opisuje czas między zdarzeniami w procesie Poissona z natężeniem lambda (czas oczekiwania na przyjazd autobusu przy założeniu że jest co 10 min)
EX=1/lambda, D²X=1/lambda² - rozkład Gaussa: definiowany przez średnią i odchylenie standardowe (wzrost ludzi)
EX=a, D²X=b, sigma=b
Na czym polega estymacja przedziałowa parametru?
estymacja przedziałowa: szacowanie przedziału, w którym z dużym prawdopodobieństwem znajduje się wartość parametru
tworzone są przedziały ufności o określonym poziome ufności, który mówi nam o prawdopodobieństwie, że rzeczywista wartość znajdzie się w przedziale (zwykle 95% lub 99%)
Wymień podstawowe narzędzia informatyczne stosowane w przetwarzaniu i analizie danych
bazy danych - MySQL, PostgreSQL
SQL - pozyskiwanie i filtracja danych
języki programowania - Python (numpy, pandas, scipy, tensorflow, matplotlib)
R - ggplot do wykresów
Tableau, Qlik, PowerBI
IBM SPSS Modeller
Jakie znasz metody redukcji wielowymiarowości? Opisz wybraną metodę
redukcja wymiarowości: proces zmniejszania liczby atrybutów w zborze danych przy jednoczesnym zachowaniu jak największej zmienności w oryginalnym zbiorze danych
- wybór cech: identyfikacja najlepszych cech
- redukcja cech: utworzenie nowych cech z oryginalnych przy minimalnej utracie informacji
PCA (Principal Component Analysis)
analiza głównych składowych, celem jest zmniejszenie wymiarowości przy zachowaniu maksymalnej zmienności informacji
założenia i kroki:
1. normalizacja danych przed
2. obliczenie macierzy kowariancji (jak zmienne liniowo razem się zmieniają)
3. obliczenie wartości i wektorów własnych (wektory definiują kierunek, a wartości “moc”)
4. sortowanie wektorów własnych malejąco (nowe osie)
5. tworzenie nowego zbioru/układu, przekształcenie na nowe współrzędne, wektory są ortogonalne
Wymień i opisz podstawowe pojęcia dotyczące relacyjnych baz danych
- baza danych: uporządkowany zbiór informacji z określoną strukturą
- relacyjna baza danych: baza danych ze zdefiniowanymi relacjami ustanawianymi przez klucze główne i obce
- system zarządzania bazą danych: program zapewniający interfejs do obsługi baz danych
- tabela: podstawowa struktura danych
- kolumna: pole tabeli zawierające dane określonego typu
- rekord: wiersz zawierający zestaw wartości dla każdej kolumny
- klucz główny: kolumna lub ich zestaw identyfikujących w unikalny sposób wiersz w danej tabeli (NOT NULL, UNIQUE, niezmienny ani nieusuwalny)
- klucz obcy: kolumna jest kluczem obcym jeśli nie jest kluczem głównym tabeli, ale jest kluczem głównym w innej tableli
- zapytanie: instrukcja do pobierania, aktualizacji, usuwania, dodawania, sortowania i łączenia danych
- relacja: zależność między tabelami umożliwiająca logiczne powiązanie (1:1, 1: N, N:N)
- transakcja: sekwencja operacji, zapewniają spójność (ACID)
Na czym polega architektura klient-serwer i gdzie się ją stosuje?
architektura klient-serwer: jeden z najpopularniejszych modeli architektonicznych stosowanych w systemach komputerowych. Podzielone na komponenty: klienci i serwery. Komunikacja między nimi opiera się na zdefiniowanych protokołach komunikacyjnych
klient: rząda usług, może być programem lub urządzeniem
serwer: sprzęt o dużych możliwościach, zwykle obsługuje wielu klientów na raz, przetwarza informacje i zapewnia odpowiedzi
przykłady zastosowania:
- sieci komputerowe (strony)
- usługi sieciowe (RESTful API, SOAP)
- bazy danych
- gry multiplayer
- systemy komunikacji (email)
Omów podstawowe zasady analityki internetowej
- określenie celów i wskaźników sukcesu: co chcemy osiągnąć i jak zmierzymy czy się nam udało
- wybór narzędzi analitycznych
- ustalenie kluczowych metryk: co będzie analizowane w kontekście osiągania celów
- analiza zachowań użytkowników: zrozumienie poruszania się po stronie
- testowanie i optymalizacja: proces cykliczny obejmujący testy i optymalizację witryny
- raportowanie i wdrażanie działań: raport jako podstawa podejmowania decyzji
Jakie znasz rodzaje wizualizacji danych?
- wykres słupkowy: zmienne kategoryczne
- wykres kołowy: udział procentowy kategorii w całości
- wykres liniowy: pokazywanie zmian wartości w czasie lub kolejności
- wykres punktowy: analiza związku dwóch zmiennych
- wykres histogramu: rozkład zmiennej numerycznej
- wykres pudełkowy: zmienne numeryczne, kwartyle, mediany
- mapa cieplna
Wymień podstawowe metody klasyfikacji danych. Porównaj 2-3 wybrane metody wskazując ich wady oraz zalety
metody klasyfikacji:
- drzewa decyzyjne
- naiwny klasyfikator Bayesa
- metoda wektorów wspierających
- sieci neuronowe
- KNN
KNN
dla każdego punktu o nieznanej klasie liczona jest odległość od pozostałych punktów. Najczęściej występująca klasa pośród K sąsiadów jest przypisywana punktowi
+prosta implementacja, brak założeń rozkładu danych, efektywność przy nieliniowych danych, skuteczny dla małych i średnich zbiorów
-wysokie wymagania wobec pamięci (porównuje każdy punkt), wrażliwość na outlierów, wrażliwość na K
drzewa decyzyjne
na podstawie cech i dostępnych etykiet algorytm wybiera cechę najlepiej dzielącą zbiór danych na jednorodne podgrupy
+interpretowalność, skuteczność w identyfikacji ważnych cech, efektywność obliczeniowa, radzi sobie z wartościami brakującymi i różnymi danymi
- skłonność do przeuczenia, nietolerancja nawet na małe zmiany w danych, trudności z zależnościami nieliniowymi
naiwny klasyfikator Bayesa
opiera się na twierdzeniu Bayesa i klasa jest przydzielana na podstawie maksymalizacji prawdopodobieństwa warunkowego
+skuteczność przy małych zbiorach treningowych, łatwa implementacja, dobrze radzi sobie z dużą liczbą cech
-zakłada niezależność cech, problem z zerowymi częstościami, założenie o jednakowej ważności cech
Wymień podstawowe metody grupowania danych. Wskaż zalety oraz wady dwóch wybranych metod
metody klasteryzacji:
- K-means
- metody hierarchiczne (dendrogram)
- metody oparte o gęstość (DBSCAN)
K-means
zakładamy liczbę skupień, losujemy położenia centroidów i przypisujemy punkty do skupień o najbliższym środku. Wyznaczamy nowe położenia będące średnią punktów w skupieniach. Powtarzamy aż dane nie przestaną się zmieniać
+prosta implementacja i szybkość, skalowalność dla dużych zbiorów, dobry do kulistych klastrów, intuicyjna interpretacja
-zależność od warunków początkowych, zależność od K, problem z różnymi gęstościami, podatny na outlierów i szum
DBSCAN
punkty są dzielone na rdzeniowe (w epsilon ma więcej niż MinPts), brzegowe (w otoczeniu mają rdzeniowy) i szumu (ani taki, ani taki). Usuwamy szum i wszystkie punkty rdzeniowe w odległości epsilon od siebie przypisujemy do klastra. Przypisujemy punkty brzegowe do grupy skojarzonej z ich rdzeniowymi
+wykrywanie grup o różnych kształtach, nie podajemy liczby klastrów, wydajność obliczeniowa (nie przechowuje całego zbioru, pomija obszary o małej gęstości), identyfikuje outlierów
-wrażliwy na epsilon in MinPts, skomplikowana interpretacja, gorzej radzi sobie z grupami o różnych gęstościach
W jaki sposób ocenia się jakość klasyfikatorów?
- macierz pomyłek: tabelaryczne przedstawienie wydajności
czułość: sen = TP/TP+FN
swoistość: spe = TN/TN+FP
precyzja: PPV = TP/TP+FP
negatywna precyzja: NPV = TN/TN+FN
dokładność: acc = TN+TP/TN+TP+FN+FP
F1 score - średnia precyzji i czułości
krzywa ROC - przedstawienie wydajności modelu (czułość X, swoistość Y)
liczymy AUC, czyli obszar pod wykresem: AUC=1 to model idealny, AUC=0.5 to model losowy, a AUC<0.5 to model niepoprawny
Co to jest Big Data i czym się charakteryzuje?
Big Data: ogromne, złożone i różnorodne zbiory danych, trudne w zarządzaniu, przetwarzaniu i analizie przy użyciu tradycyjnych narzędzi
cechy Big Data:
1. Volume: zbiory są ogromne i pochodzą z różnych źródeł
2. Variety: wielorakość formatu, dane są nieustrukturyzowane i nie pasują do żadnej standardowej bazy danych, przyrastają wykładniczo
3. Velocity: szybkie tempo generowanie i akwizycji danych, napływają w czasie rzeczywistym i krótkich odstępach czasu
Podaj przykłady zastosowań Big Data
- analiza rynku i konsumenta: analiza zachowań i preferencji (dane transakcji, aktywność w mediach, demograficzne)
- medycyna i opieka zdrowotna: poprawa diagnozowania i analizy skuteczności terapii, monitorowanie epidemii (dane pacjentów, wyniki badań, historie chorób)
- finanse i bankowość: analiza ryzyka i wykrywanie oszustw, analiza rynku
- transport i logistyka: optymalizacja tras, przepływ ruchu, prognoza popytu (dane z monitoringu, GPS, czujników pojazdów)
- badania naukowe: identyfikacja wzorów, modele predykcyjne, nowe zależności
- smart city: zarządzanie zasobami miejskimi, optymalizacja transportu publicznego, poprawa jakości życia (dane z czujnków IoT, monitoringu miejskiego, mediów)
Co to jest IoT? Podaj przykłady zastosowań
IoT: sieć połączonych urządzeń komunikujących się wspólnie ze sobą i z ludźmi za pomocą internetu. Rozszerzenie internetu na fizyczne przedmioty i urządzenia
rzeczy IoT mają ciągły dostęp do internetu, przechowują dane w chmurze i przetwarzają big data
przykłady zastosowań:
- smart home
- smart city
- opieka zdrowotna
- przemysł 4.0
- rolnictwo inteligentne
- pojazdy autonomicczne
Zdefiniuj czym są systemy Business Intelligence i podaj przykład takiego systemu
systemy Business Intelligence (BI): zintegrowane narzędzia i technologie służące do zbierania, przechowywania, analizowania i prezentowania danych biznesowych. Celem jest wgląd do działalności organizacji i identyfikacji trendów, wykrywanie wzorców i podejmowanie decyzji biznesowych
PowerBI
Modelowanie danych i modelowanie procesów. Definicje i przykłady
modelowanie danych: technika organizowania i dokumentowania danych. Tworzy wizualną reprezentację danych i ich związków, pomaga zrozumieć jak dane są przechowywane (diagram UML, relacyjne bazy danych)
model procesu: diagram, który przedstawia kolejność wykonywanych czynności - czyli kroków procesu, pokazuje zdarzenia, działania i połączenia
Wymień przykłady statystycznych modeli generatywnych i ich przykłady
statystyczny model generatywny: model probabilistyczny, który ma zdolność do generowania nowych przykładów danych, które są podobne do danych uczących, na podstawie których został wytrenowany
- VAE/WAE: model składa się z enkodera przekształcającego dane wejściowe i dekodera odbudowującego dane wejściowe
- GAN: składa się z generatora generującego nowe próbki i dyskryminatora, który odróżnia prawdziwe próbki od wygenerowanych, iteracyjnie tworzy je coraz lepszymi
- auto-regressive models: opierają swoje przewidywania na wcześniejszych wartościach czasowych tej samej zmiennej lub zbiorze zmiennych, często stosowane do sszeregów czasowych
- flow-based models: pozwalają na generowanie nowych przykładów danych poprzez przekształcanie rozkładu prawdopodobieństwa za pomocą odwzorowań przepływów
Kwantytatywna analiza języka i stylu i jej zastosowania
kwantytatywna analiza języka i stylu: zastosowanie metod ilościowych i statystycznych do badania cech językowych i stylowych w tekście
- analiza autora
- analiza sentymentu
- klasyfikacja tekstu
- badania socjolingwistyczne
Data journalism
data journalism: forma dziennikarstwa, gdzie analiza i prezentacja danych odgrywają kluczową rolę w procesie tworzenia informacji i raportowania wydarzeń. Pozwala na weryfikację informacji i poddanie krytycznej analizie twierdzeń lub deklaracji bądź odkrywania nowych wzorców, trendów i zależności
kroki:
1. identyfikacja tematu
2. zebranie danych
3. oczyszczanie danych i uzupełnianie braków
4. analiza danych
5. interpretacja i narracja
6. prezentacja
Jakie są narzędzia do analizy testów A/B, śledzenia kliknięć i ruchów myszki
narzędzia do analizy testów A/B
- Google Optimize: integruje się z GA, pozwala na personalizację, testowanie i analizę wyników
- Optimizely: testy A/B, testy wielowariantowe, testy na podstawie celów, integruje się z innymi narzędziami
- VWO: testy A/B, testy wielowariantowe, integruje się z innymi narzędziami
- AB Tasty: narzędzie do testowania stron internetowych
- Crazy Egg: mapy ciepla, analiza zachowań użytkowników, testowanie wersji strony
narzędzia do śledzenia kliknięć
- Hotjar: kliknięcia, nawigacja i przewijanie strony, generuje mapy ciepła
- Crazy Egg: mapy ciepła i podgląd kliknięć in real time
- Mouseflow: pozwala na odtwarzanie sesji, analizę zachowań, generowanie map ciepła
Na czym polega eyetracking i jakie jest jego zastosowanie w badaniu interfejsów
eyetracking: monitorowanie ruchu oczu i analiza sposobu, w jaki osoba skanuje i spogląda na elementy, wykorzystuje eyetracker
badania pozwalają stwierdzić w jaki sposób użytkownik patrzy na obiekt, co przyciąga uwagę, w jakiej kolejności, co rozprasza uwagę, co jest pomijane
- optymalizacja układu interfejsu
- poprawa użyteczności
- badanie wzorców nawigacyjnych
- ocena efektywności reklam i treści
- weryfikacja intuicyjności
Porównaj subiektywne i obiektywne metody badania doświadczeń użytkownika
subiektywne
ankiety i wywiady, testy użyteczności (opisywanie doświadczeń), ewaluacja heurystyczna - mała próba, dane jakościowe
obiektywne
testy A/B, śledzenie zachować irl, eye-tracking, metryki wydajności - duża próba, dane ilościowe
Jakie są zasady, które odnoszą się do teorii percepcji Gestalt, wykorzystywanej przy projektowaniu interfejsów
teoria percepcji mówi, że całość różni się jakościowo od sumy części
zasady:
1. podobieństwo
2. bliskość
3. ciągłość
4. domknięcie (uzupełnianie brakujących elementów)
5. symetria i równowaga
6. zasada figury i tła
—dodatkowo—
7. zasada wspólnego losu
8. zasada obszaru wspólnego
9. zasada łączności
Jakie są standardy i wytyczne dotyczące dostępności (ang. accessibility) treści internetowych
accessibility: standardy i wytyczne zapewniające, że treści online są dostępne dla największej grupy odbiorców
wytyczne:
1. postrzegalność: czytelność dla wszystkich (obejmuje tekst alternatywny, transkrypcje video i audio, kontrast, czytelność przy zoomie 200%)
2. funkcjonalność: działające rozwiązanie niezależnie od urządzenia wejściowego (obsługa tylko przez klawiaturę, brak migających treści, ruchomych elementów)
3. zrozumiałość: jasne przedstawienie treści (prosty język, wytłumaczenia jeśli nie, zapobieganie błędom)
4. solidność: treść kompatybilna z różnymi technologiami (kod zgodny ze standardem HTML)
WCAG (Web Content Accessibility Guidelines): Jest to międzynarodowy zestaw wytycznych opracowany przez W3C (World Wide Web Consortium), który określa jak tworzyć dostępne treści internetowe
ADA (Americans with Disabilities Act): Jest to amerykańskie prawo, które określa wymogi dostępności dla publicznych miejsc, w tym stron internetowych
Czym jest Design System
design System: zorganizowany zbiór zasad, standardów, narzędzi i komponentów, które służą do projektowania i rozwijania spójnych interfejsów użytkownika. Pozwala to tworzyć spójne, skalowalne interfejsy i współpracować grupowo nad projektem
kluczowe elementy:
- style i zasady wizualne
- komponenty interfejsu
- zasady interakcji (animacje, responsywność)
- dokumentacja i przewodniki (przykładowe zastosowania)
- narzędzia i zasoby (kod React, Angular)
Material Design, Carbon Design System (IBM), Fluent Design System (MS)
Czym jest User Centered Design?
UCD koncentruje się na potrzebach i oczekiwaniach użytkowników (discover, define, ideate, design)
- zrozumienie użytkowników
- iteracyjny proces projektowania
- zaangażowanie użytkowników
- fokus na doświadczenie użytkownika
przykłady: aplikacje mobilne, strony www, produkty fizyczne
Podstawowe funkcje nauki (deskryptywna, eksplanacyjna, predyktywna, praktyczna)
- deskryptywna: opisuje zjawiska zachodzące w społeczeństwie, mówi jak jest (np.: opis klas społecznych, ich struktury)
- eksplanacyjna: wyjaśnia przyczyny zjawisk, opisuje dlaczego coś się dzieje (np.: wyjaśnienie wysokiego poziomu przestępczości w niektórych społeczeństwach)
- predyktywna: przewiduje przyszłe zjawiska, mówi jak będzie (np.: prognoza zmian demograficznych)
- praktyczna: wykorzystuje wiedzę naukową do rozwiązywania problemów w praktyce (np.: wykorzystanie psychologii społecznej do poprawy skuteczności kampanii)
Społeczeństwo nowoczesne w sensie historycznym i analitycznym (następstwo wielkich rewolucji; aspekty nowoczesności: indywidualizm, dyferencjacja, racjonalność, ekonomizm, ekspansywność; rozczarowanie nowoczesnością)
społeczeństwo nowoczesne: termin używany w kontekście do opisu społeczeństw, które przeszły przez proces modernizacji i wykazują cechy charakterystyczne dla okresu nowoczesności. Wynikło z wielkich rewolucji
- indywidualizm: nacisk na wartość jednostki i jej prawa, autonomia, wolność wyboru
- racjonalność: rozwój intelektualny, analiza faktów, logika, racjonalne działania
- dyferencjacja: rosnąca różnorodność społeczna, ekonomiczna i kulturowa
- ekonomizm: ekonomiczne podejście do życia
- ekspansywność: dążenia do rozwoju, ekspansji i postępu
rozczarowanie nowoczesnością
społeczeństwo nowoczesna stawia wiele wyzwań i problemów
- alienacja: izolacja, utrata więzi społecznych
- anomia: bezcelowość
- wojny
- kultura masowa, pospolitość
- nierówności społeczne
Późna nowoczesność i jej cechy (zaufanie, ryzyko, nieprzejrzystość, globalizacja)
późna nowoczesność: postmodernizm, ponowoczesność, odnosi się do okresu następującego po pierwszej fazie społeczeństwa nowoczesnego. Dochodzi do rozmycia granic między kulturą wysoką a popularną, jednostki mają większą swobodę w kształtowaniu tożsamości
- zaufanie: zubożenie zaufania, podejrzliwość wobec instytucji i autorytetów, wzrost indywidualizmu, wiara ekspertom
- ryzyko: niepewność, nieznane i nieprzewidywalne, świadomość zagrożeń fizycznych i ekonomicznych
- nieprzejrzystość: wzrasta liczba informacji, świat jest skomplikowany i nieprzewidywalny
- globalizacja: świat jest połączony i zintegrowany, ma plusy i minusy
Wizje i teorie cyklicznych zmian społecznych (G. Vico, O. Spengler, A. Toynbee, P. Sorokin, S. Huntington)
wizje i teorie cyklicznych zmian społecznych: sugerują, że historię ludzkości można interpretować jako sekwencję okresów wzrostu, rozkwitu, upadku i regeneracji
Giambattista Vico
3 cykle: epoka bogów (religia, surowe prawo), bohaterów (surowe obyczaje, poezja) i ludzi (samowiedza i samozaufanie, język prozaiczny)
narzędzia poznania: wiara, wyobraźnia, intelekt
Oswald Spengler
“Zmierzch Zachodu”
dzieje powszechne stanowią panoramę ośmiu kultur będących wyrazem ośmiu rodzajów dusz przechodzących przez stadia młodości, dojrzałości i starczy upadek
Arnold Toynbee
“Teoria Wielkiego Cyklu”
cywilizacje rodzą się z odpowiednich wyzwań, rozwijają się, a następnie upadają z powodu braku odpowiedzi na nowe wyzwania, wśród rozwijających się występują wybitne jednostki
Pitirim Sorokin
historia nie ma jednego kierunku, nie można prosto przewidywać przyszłości
trzy systemy kulturowe, ich sekwencja: ideacyjna (potrzeby duchowe), idealistyczna (pośrednia), zmysłowa (materialność)
istotą zmiany są czynniki wewnętrzne
Samuel Huntington
“Zderzenie Cywilizacji”
konflikty między różnymi cywilizacjami są głównym źródłem zmian społecznych
Podział współczesnego świata na państwa „centra” i „peryferie” (teorie zależności, eksploatacja i wyzysk peryferii, I. Wallerstein i symptomy „końca” kapitalizmu)
Immanuel Wallerstein
- teorie zalezności: świat kapitalistyczny składa się z centrów i peryferii. Kraje centrów wykorzystują przewagę technologiczną i ekonomiczną do kontroli zasobów i rynków krajów peryferii (kontrola przez nierówności w wymianie, złe warunki kredytowe)
symptomy “końca” kapitalizmu
- deruralizacja: nie ma terenów rolnych i taniej siły roboczej
- demokratyzacja: pracownicy chcą lepszych płac, emerytury, ubezpieczeń
- kryzys państwa: państwa narodowe rozwijały kapitalizm, a teraz tracą na rzecz organizmów transnarodowych
- kryzys ekologiczny - kapitalizm nie ma pieniędzy na przywrócenie równowagi ekologicznej
Omów zróżnicowanie społeczne – czym jest, jakie są jego wymiary i konsekwencje?
zróżnicowanie społeczne (dyferencjacja społeczna): występowanie różnic pomiędzy ludźmi, kategoriami i grupami społecznymi. Różnice te mogą wynikać np. z wieku, płci, wykonywanej pracy, statusu społecznego a nawet stylu życia
wymiary
klasa, stan, partia
- wykształcenie
- dochody
- poziom konsumpcji
- styl życia
- aktywność kulturalna
- partycypacja polityczna
konsekwencje
- nierówności
- wykluczenie społeczne
- napięcia i konflikty
- dysktyminacja
- różnice jako źródło bogactwa
Na czym polega zmienność społeczna?
zmienność społeczna: ciągłe, dynamiczne zmian w strukturze społecznej, normach, wartościach, instytucjach i relacjach społecznych w czasie
typy zmian
- składu
- systemu (nowe idee, poglądy, normy)
- funkcji
- granic (łączenie partii)
- w otoczeniu systemu
przyczyny zmian
- zmiany w środowisku
- procesu kulturowe
- odkrycia i wynalazki
- dyfuzja
- zmiany w strukturze społecznej
- zmiany ludnościowe
- zmiany związane z rozwojem nauki i technologii
- działalność zbiorowa lub indywidualna
Czym jest wykluczenie cyfrowe?
wykluczenie cyfrowe: sytuacja, w której pewne jednostki lub grupy społeczne nie mają dostępu do technologii informacyjnych i komunikacyjnych lub nie potrafią z nich korzystać w pełni
przyczyny
- brak dostępu do infrastruktury
- koszty
- brak umiejętności technicznych
- wykluczenie społeczne
Czym jest społeczeństwo informacyjne?
społeczeństwo informacyjne: społeczeństwo, w którym informacje odgrywają kluczową rolę w procesach społecznych, gospodarczych i kulturowych, a technologie informacyjne i komunikacyjne są integralną częścią życia społecznego
cechy:
- dostęp do informacji
- komunikacja cyfrowa
- innowacje technologiczne
- przemiana gospodarki
- edukacja cyfrowa
Czym jest społeczeństwo sieciowe?
społeczeństwo sieciowe: rodzaj społeczeństwa informacyjnego. Zakłada się, iż w tym typie społeczeństwa najważniejszą rolę pełni sieć relacji i międzyludzkich powiązań. Ludzie swobodnie i dowolnie wybierają swoich towarzyszy. Komunikacja i działania jednostek odbywają się głównie poprzez sieci komputerowe i media społecznościowe.
cechy:
- globalność
- interaktywność
- szybkość i natychmiastowość
- dostępność do informacji
- różnorodność kulturowa i społeczna
Na czym polega dynamika rozwoju nowych technologii informacyjnych i komunikacyjnych
dynamika rozwoju nowych technologii informacyjnych i komunikacyjnych: proces ciągłego ulepszania i innowacji w dziedzinie technologii, które wpływają na sposób, w jaki ludzie komunikują się, przetwarzają informacje i korzystają z nich
cechy:
- przyspieszona innowacja (szybkie tempo zmian)
- konwergencja technologiczna (kompleksowość urządzeń)
- globalizacja cyfrowa (globalna komunikacja)
- transformacja biznesowa
- wyższe wymagania wobec umiejętności technologicznych
- wyzwania etyczne i społeczne (prywatność, nierówności społeczne)
Czym są nowe media?
nowe media: formy komunikacji i technologii, które powstały w wyniku postępu technologicznego, zwłaszcza w erze cyfrowej. Charakteryzują się interaktywnością, multimedialnością, dostępnością w czasie rzeczywistym, istnieje możliwość personalizacji treści, umożliwiają użytkownikom aktywne uczestnictwo w procesie tworzenia i dystrybucji treści
- internet
- media społecznościowe
- platformy wideo na żądanie
- aplikacje mobilne
- gry online
Na czym polega komunikowanie i jakie są jego poziomy (od interpersonalnego do sieciowego)? Jakie są rodzaje struktur komunikacyjnych?
komunikacja: proces, zjawisko funkcjonujące między nadawcą a odbiorcą, proces przekazywania i odbierania informacji
poziomy komunikacyjne
- interpersonalna
- grupowa
- organizacyjna
- publiczna
- sieciowa
struktury komunikacyjne
- łańcuch
- okrąg
- koło u wozu (lider od każdego z osobna)
- każdy z każdym
- Y
Czym jest Internet Rzeczy?
IoT: koncepcja, w której różne urządzenia i przedmioty codziennego użytku są połączone z Internetem i mogą komunikować się między sobą oraz z użytkownikami, zbierając i wymieniając dane
- koneksja
- automatyzacja
- zbieranie danych
- analiza i reakcja
przykłady zastosowań:
- smart homes
- zdrowie i medycyna
- przemysł
- transport
Na czym polega sharing economy?
sharing economy: gospodarka współdzielenia, model ekonomiczny oparty na dzieleniu się zasobami, usługami lub dobrami za pośrednictwem platform cyfrowych, opiera się na idei maksymalnego wykorzystania zasobów oraz budowania społeczności zaufania
cechy:
- platformy cyfrowe
- krótkoterminowe transakcje
- wzajemne zaufanie
przykłady: Uber, Lyft, Airbnb, WeWork, Fat LLama