Wykład 3 - Pandas Flashcards
dwa typy danych wprowadzone w Pandas
serie (Series) oraz ramki danych (DataFrame)
Tworzenie Series z listy przy inicjowaniu
s = pd.Series([1,2,3,4])
Co oferuje pandas
Nastawiony na przetwarzanie tablic, oferuje wiele funkcji na nich operujących i umożliwa przetwarzanie danych bez pętli for
Największa różnica między pandas a numpy
Pandas została zaprojektowana z myślą o pracy z danymi w formie tabeli lub danymi o charakterze heterogenicznym, a biblioteka NumPy jest zoptymalizowana pod kątem pracy z homogenicznymi tablicami danych liczbowych
Jednowymiarowy obiekt przypominający tablicę. Składa się on z sekwencji wartości i ich indeksów.
Series
- Wyświetl wartości obiektu Series “obj”
- Wyświetl jak wyglądają indeksy w tym obiekcie
-
obj.values
:
Out:array([1, 2, 3, 4])
-
obj.index
:
Out:RangeIndex(start=0, stop=4, step=1)
Często będziesz chciał utworzyć obiekty typu Series z indeksem identyfikującym każdy element serii za pomocą etykiety. W ten sposób to zrobisz
obj2 = Series([3, 4, 7], index=['a', 'd', 'e'])