SQL Flashcards

Question

Consistency:

Answer 1

Spójność zapewnia, że transakcja przenosi bazę danych z jednego prawidłowego stanu do innego. Baza danych musi być zgodna z zestawem reguł i ograniczeń zdefiniowanych przez schemat. Jeśli transakcja narusza którąkolwiek z tych reguł, jest wycofywana, a baza danych pozostaje w spójnym stanie.

Answer 2

Izolacja zapewnia, że realizacja transakcji jest od siebie niezależna. Każda transakcja wydaje się być wykonywana w izolacji, bez zakłóceń ze strony innych równolegle wykonywanych transakcji. Ta właściwość zapobiega interferencji stanów niekompletnych lub pośrednich jednej transakcji z drugą. Różne poziomy izolacji, takie jak Odczyt niezatwierdzony, Odczyt zatwierdzony, Powtarzalny odczyt i Serializowalny, definiują stopień izolacji w systemie bazy danych.

Answer 3

Trwałość zapewnia, że raz zatwierdzona transakcja jej skutki są trwałe i przetrwają kolejne awarie, takie jak przerwy w dostawie prądu lub awarie. Zatwierdzone zmiany są przechowywane na stałe w bazie danych, a nawet w przypadku awarii systemu baza danych może zostać przywrócona do spójnego stanu

Answer 4

Create (Tworzenie): Dodawanie nowych danych do systemu. Na przykład, dodawanie nowego rekordu do bazy danych. Read (Odczyt): Pobieranie danych z systemu. To może obejmować odczytanie jednego lub wielu rekordów z bazy danych. Update (Aktualizacja): Modyfikowanie istniejących danych w systemie. Przykładowo, aktualizacja informacji w rekordzie bazy danych. Delete (Usuwanie): Usuwanie danych z systemu. To może obejmować usunięcie jednego lub wielu rekordów z bazy danych.

Answer 5

Operacja MERGE jest przydatna w sytuacjach, gdzie chcemy synchronizować dane między dwiema tabelami na podstawie określonych warunków, eliminując konieczność stosowania wielu zapytań INSERT, UPDATE i DELETE.

Answer 6

Polecenie DROP całkowicie usuwa tabelę z bazy danych, w tym strukturę tabeli i wszystkie skojarzone ograniczenia, relacje z innymi tabelami i prawa dostępu. TRUNCATE usuwa wszystkie wiersze z tabeli bez wpływu na strukturę tabeli i ograniczenia. DROP działa wolniej niż TRUNCATE. Oba są nieodwracalnymi poleceniami DDL (Data Definition Language). DELETE to odwracalne polecenie DML (Data Manipulation Language) służące do usuwania jednego lub większej liczby wierszy z tabeli na podstawie warunków określonych w klauzuli WHERE. Zamiast tego TRUNCATE jest nieodwracalnym poleceniem DDL (Data Definition Language) używanym do usuwania wszystkich wierszy z tabeli. Polecenie DELETE działa wolniej niż TRUNCATE. Nie możemy również użyć instrukcji TRUNCATE dla tabeli zawierającej klucz obcy.

Answer 7

Numeric data types such as: INT, TINYINT, BIGINT, FLOAT, REAL, etc. Date and Time data types such as: DATE, TIME, DATETIME, etc. Character and String data types such as: CHAR, VARCHAR, TEXT, etc. Unicode character string data types such as: NCHAR, NVARCHAR, NTEXT, etc. Binary data types such as: BINARY, VARBINARY, etc. Miscellaneous data types: CLOB, BLOB, XML, CURSOR, TABLE, etc

Answer 8

Konwersje niejawne wykonywane są przez silnik bazy danych automatycznie, bez udziału i wiedzy użytkownika. Przykładowo gdy wartość typu SMALLINT porównywana jest z wartością typu INT, w celu porównania wartość SMALLINT zostanie uprzednio skonwertowana na typ INT. Konwersje jawne wykonywane są na wyraźne polecenie użytkownika za pośrednictwem wywołanej przez niego funkcji CAST lub CONVERT, np. CAST ( 120 AS VARCHAR(10) ).

Answer 9

Transakcja jest jednostką pracy lub zestawem instrukcji DML (tj. INSERT, UPDATE i DELETE), które powinny być wykonywane jako jedna jednostka. Transakcja gwarantuje, że wszystkie polecenia zakończą się powodzeniem lub żadne z nich. Jeśli jedno z poleceń w transakcji zakończy się niepowodzeniem, wszystkie polecenia zakończą się niepowodzeniem, a wszystkie dane zmodyfikowane w bazie danych zostaną wycofane

Answer 10

COMMIT jest poleceniem używanym w transakcyjnych systemach zarządzania bazą danych do potwierdzenia wszystkich operacji dokonanych w trakcie trwania danej transakcji.

Answer 11

ROLLBACK jest poleceniem używanym do cofnięcia wszystkich operacji wykonanych w trakcie trwania danej transakcji.

Answer 12

Czyli Data Control Language, to część języka SQL odpowiedzialna za kontrolę dostępu do danych. W ramach DCL występują polecenia służące do zarządzania uprawnieniami (prawami dostępu) do różnych obiektów w bazie danych. GRAN i REVOKE

Answer 13

Jest rozwiązaniem ETL dostępnym w ramach pakietu SQL Server, skoncentrowanym głównie na integracji i przetwarzaniu danych w lokalnym środowisku. ADF natomiast to usługa zarządzania i przetwarzania danych w chmurze, umożliwiająca elastyczne i skalowalne przetwarzanie danych w środowisku chmurowym Azure.

Answer 14

W kontekście transformacji danych (ETL - Extract, Transform, Load): W procesach ETL, mapping odnosi się do przyporządkowania pól danych z jednego źródła do odpowiednich pól w docelowym systemie lub strukturze danych. Przykładowo, w narzędziach do przetwarzania danych, takich jak SQL Server Integration Services (SSIS) lub Apache NiFi, konfigurujesz mapping, aby określić, które dane z źródła mają zostać przekształcone i gdzie mają zostać załadowane w docelowej bazie danych.

Answer 15

W programie SQL Server jest podobny do tabeli wirtualnej, która zawiera dane z jednej lub wielu tabel. Nie przechowuje żadnych danych i nie istnieje fizycznie w bazie danych. Podobnie jak w przypadku tabeli SQL, nazwa widoku powinna być unikatowa w bazie danych. Zawiera zestaw predefiniowanych zapytań SQL do pobierania danych z bazy danych. Może również zawierać tabele baz danych z jednej lub wielu baz danych. Widoki są używane w różnych sytuacjach, zwłaszcza w projektowaniu baz danych, aby uprościć dostęp do danych i zwiększyć bezpieczeństwo.

Answer 16

W bazach danych są strukturami optymalizacyjnymi, które przyspieszają dostęp do danych w tabelach. Działają podobnie do indeksów w książce, umożliwiając szybsze wyszukiwanie i sortowanie danych. W związku z tym, indeksy mogą znacznie poprawić wydajność zapytań, ale jednocześnie wprowadzają pewne koszty w zakresie przechowywania i aktualizacji.

Answer 17

Tylko jeden indeks klastrowany na tabelę, podczas gdy możemy mieć więcej niż jeden indeks nieklastrowany. Indeks klastrowany jest nieco szybszy niż indeks nieklastrowany. Dzieje się tak, ponieważ gdy jest używany indeks nieklastrowany, istnieje dodatkowe wyszukiwanie z indeksu nieklastrowanego do tabeli, aby pobrać rzeczywiste wiersze. Indeks klastrowany określa kolejność przechowywania wierszy w tabeli i dlatego nie wymaga dodatkowego miejsca na dysku, podczas gdy indeks nieklastrowany jest przechowywany oddzielnie od tabeli, wymagane jest dodatkowe miejsce do magazynowania. Indeks klastrowany jest specjalnym typem indeksu, który zmienia kolejność sposobu fizycznego przechowywania rekordów w tabeli. W związku z tym tabela może mieć tylko jeden indeks klastrowany. Indeks nieklastrowany jest specjalnym typem indeksu, w którym kolejność logiczna indeksu nie jest zgodna z fizyczną kolejnością przechowywanych wierszy na dysku.

Answer 18

Indeks klastrowany służy do porządkowania fizycznej kolejności tabeli i wyszukiwania na podstawie wartości klucza. Każda tabela może mieć tylko jeden indeks klastrowany. Indeks ten jest jedynym indeksem, który został utworzony automatycznie po wygenerowaniu klucza głównego. Klucz ten jest preferowany jeżeli niezbednę są umiarkowane modyfikacje w danych tabeli. Powodem utworzenia tego indeksu jest wyszukiwanie danych. Z poprzedniego pytania wiemy, że indeks klastrowany jest tworzony automatycznie, gdy dodawne są klucze główne. Z kolei indeksy nieklastrowane są tworzone, gdy w zapytaniu używane są warunki wielu połączeń oraz filtry. Indeks bez klastrowania nie zmienia fizycznej kolejności tabel i utrzymuje logiczną kolejność danych. Każda tabela może zawierać 999 nieklastrowych indeksów.

Answer 19

W kontekście SQL, optymalizacja odnosi się do procesu poprawiania wydajności i efektywności zapytań SQL oraz operacji na bazie danych. Celem optymalizacji SQL jest zazwyczaj skrócenie czasu wykonywania zapytań, zminimalizowanie zużycia zasobów, takich jak pamięć czy procesor, oraz ogólnie usprawnienie działania systemu bazodanowego. Optymalizacja SQL może obejmować różne aspekty, w tym: Indeksowanie: Dodawanie indeksów do kolumn, które są często używane w warunkach WHERE, JOIN czy ORDER BY w celu przyspieszenia procesu wyszukiwania. Struktura Tabeli: Optymalizacja struktury tabeli, takie jak odpowiedni dobór typów danych, unikanie redundancji danych, a także partycjonowanie dużych tabel. Pisanie Optymalnych Zapytań: Skonstruowanie zapytań w sposób optymalny, unikanie subzapytań tam, gdzie można użyć JOIN, unikanie funkcji na kolumnach w warunkach WHERE, czy też minimalizacja używania SELECT *.

Answer 20

To biblioteka programistyczna w języku Python, która umożliwia efektywną manipulację i analizę danych. Główne zastosowania Pandas to przetwarzanie danych, analiza danych, a także czyszczenie i transformacja danych.

Answer 21

To jednowymiarowy obiekt danych w Pandas, przypominający jednowymiarową tablicę lub listę. Składa się z indeksu i odpowiadających mu wartości.

Answer 22

To dwuwymiarowa struktura danych w Pandas, przypominająca tabelę lub arkusz kalkulacyjny. Składa się z wierszy i kolumn, gdzie każda kolumna może być różnego typu danych.

Answer 23

To struktura danych w Pandas, służąca do jednoznacznego identyfikowania i dostępu do elementów w obiektach Series i DataFrame. Może być jednowymiarowy lub wielowymiarowy.

Answer 24

Pipeliny w Azure Data Factory to logiczne struktury, które definiują sekwencję operacji przetwarzania danych. Mogą zawierać różne działania, takie jak kopiowanie danych, transformacje, uruchamianie skryptów, itp. Pipeliny umożliwiają zorganizowanie i zarządzanie przepływem danych od źródła do miejsca docelowego w sposób uporządkowany.

Answer 25

Data Flowy w Azure Data Factory są częścią pipeline'u, które definiują przetwarzanie danych na poziomie przepływu danych. Pozwalają na definiowanie transformacji danych, filtrowania, sortowania i innych operacji przetwarzania danych na etapie przepływu. Umożliwiają bardziej zaawansowane przekształcenia danych niż proste kopiowanie.

Answer 26

Zbiory Danych w Azure Data Factory to struktury, które reprezentują dane w źródle lub miejscu docelowym. Mogą być rozumiane jako reprezentacje logiczne lub fizyczne danych, takie jak tabela w bazie danych, plik CSV, itp. Zbiory danych są używane do zdefiniowania, skąd dane są pobierane lub gdzie są zapisywane w trakcie przetwarzania w pipeline'ach. W skrócie, Pipeline to sekwencja działań, Data Flow to struktura definiująca przetwarzanie danych, a Data Set to reprezentacja źródła lub miejsca docelowego danych. Te elementy są kluczowe w projektowaniu, implementacji i zarządzaniu przepływem danych w Azure Data Factory.

Answer 27

To skrót od trzech terminów: Extract, Transform, Load. Jest to model przetwarzania danych, powszechnie stosowany w dziedzinie magazynów danych (data warehousing) i systemów analitycznych. Proces ETL obejmuje trzy główne etapy:

Answer 28

W fazie ekstrakcji dane są pobierane z różnych źródeł danych. Mogą to być różne systemy bazodanowe, pliki CSV, API, czy inne źródła danych. Dane są wyciągane w surowej postaci z oryginalnych źródeł.

Answer 29

W fazie transformacji dane są przekształcane i modyfikowane zgodnie z wymaganiami biznesowymi. Transformacje obejmują strukturalne zmiany w danych, filtrowanie, normalizację, agregacje, a także czyszczenie danych i usuwanie duplikatów. Celem jest dostosowanie danych do celów analitycznych oraz poprawa ich jakości.

Answer 30

W fazie ładowania przetworzone dane są wprowadzane do docelowego magazynu danych lub bazy danych analitycznej. Mogą to być magazyny danych, hurtownie danych, bazy danych analityczne czy inne systemy, które przechowują dane w gotowej do analizy formie. Proces ETL umożliwia gromadzenie, przekształcanie i przenoszenie danych z różnych źródeł do jednego centralnego miejsca, które jest zoptymalizowane pod kątem analizy i raportowania. Jest to kluczowe w kontekście biznesowej analizy danych, raportowania oraz podejmowania decyzji strategicznych. Odpowiednie narzędzia ETL pozwalają na efektywne zarządzanie dużymi ilościami danych i ich przekształcanie w użyteczną wiedzę.

Answer 31

Obie funkcje służą do porządkowania wartości oraz przypisywania im konkretnych numerów, w zależności od ich wzajemnego położenia. Różnica między nimi sprowadza się do tego, w jaki sposób obie funkcje obsłużą identyczne wartości. W przypadku, w którym wartość x będzie miała pozycję 2, funkcja RANK () przypisze kolejnej najniższej wartości pozycję 4 (pominie następna dostępną wartość w rankingu), podczas gdy funkcja DENSE_RANK() przypisze kolejnej najniższej wartości pozycję 3 (zgodnie z porządkiem chronologicznym).

Answer 32

DDL (Data Definition Language): DDL obejmuje polecenia używane do definiowania struktury bazy danych. Są to operacje, które wpływają na schemat bazy danych, tabele, indeksy i inne obiekty bazodanowe. Przykłady poleceń DDL to CREATE, ALTER i DROP.

Answer 33

Jest typem złączenia, w którym z dwóch zbiorów (tabel czy podzapytań) bierzemy tylko ich część wspólną, ale jedynie w sytuacji gdy w obu zbiorach istnieje tak samo nazwana kolumna (lub więcej tak samo nazwanych kolumn).

Answer 34

Relacja, Encja

Answer 35

Krotka, Instancja

SQL Flashcards

(60 cards)