Carga De Dados Flashcards
Leitura e abertura de arquivos
Como funciona a função pd.read_csv()
Ele abre arquivos csv, com o sep=’,’ podemos altera-la.
Função pd.read_table( )
Lê arquivos tabulares com o sep=/
Pra q são usadas estás funções do pandas
read_json( )
Função read_csv()
Função read_table()
Todas fazer a abertura de arquivos
Lê dados de uma representação em strings json
Le aquivos csv com o sep=,
Lê aquivos de formato table com o sep=/
Parâmetros na abertura dos arquivos:
Sep= Header= Names= Sep=\s+ Skiprows= Index_col=
Sep(e a divisão de linha )
Header(atribui valores as colunas, podemos passar None)
Names(atribui valores as colunas, podemos passar listas)
Sep=\s+(consegue separar usando espaços em branco na abertura)
Skiprows (pula as linhas q vc desejar, passando uma lista com as linhas desejadas)
Index_col(pega uma coluna e transforma em Index)
Como fazer uma indexação hierárquica?
Na hora de atribuir um Index coloque dois conchetes
Index=[[hshh, jsh], [hehhs, shgdb]]
Columns=[[hshh, jsh], [hehhs, shgdb]]
Como atribuir valores na, na abertura de aquivos ??
Podemos passa uma lista com o nome do valor, para a função na_values
Ou podemos criar uma dict com valores “sentinelas”, neste dict tem q conter, o nome da coluna como Key, e os valores q vão ser nan em uma lista de for mas de um valor
Função do pandas:
To_csv()
Pega um dado q esteja em uma string ( pode ser um dict, array, dataframe, serie,……) E o transforma em arquivo salvo na memória
Ex
Data.to_csv(local e nome)
Pronto, agora ele está salvo na sua memória
Metodo da biblioteca json
Json.load()
Json.dumps()
Como utilizar, e pra q serve??
Json.load serve para transformar dados em json para python
Json.dumps serve para transformar dados python para json
Import json
Json.load(dados)
Json.dumps(dados)
Como ler APIs usando a biblioteca requests e json??
Primeiro temos q importar ambos
Import json; import requests
Depois passar a URL para request ler
Resp = requests.get(url)
Resp
O metodo json do objeto response devolverá um dict contendo o parse dos dados json
Data = resp.json()
Data[0][‘title’]
Cada elemento em data e um dict, então podemos criar um dataframe partir disto:
Page = pd.dataframe(data, columns=[nomes das colunas q estão em data])
Pronto