You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Função que converte de "object" (string) para "date" (pois a pandas reconhece datas como objetos por padrão)
data['date'] =pandas.to_datetime(data['date'])
Mostrar os tipos de variaveis em cada coluna
print(data.dtypes)
Converter o tipo de uma variável
1. object -> date (igual ao 6)
data['date'] =data['date'].astype(datetime64)
2. integer -> float
data['bedrooms'] =data['bedrooms'].astype(float)
3. float -> integer
data['bedrooms'] =data['bedrooms'].astype(int64)
Note: int64 significa que os tipos das variáveis estão, e devem estar, em 64 bits. Caso seja 32 bits (int32, float32), todos devem ser em 32 bits, pois 64 e 32 não são comparáveis.
4. integer -> string
data['bedrooms'] =data['bedrooms'].astype(str)
Note: strings são considerados obejcts.
5. string -> integer
data['bedrooms'] =data['bedrooms'].astype(int64)
6. string -> date
data['date'] =pandas.to_datetime(data['date'])
PARA VISUALIZAÇÃO!
print(data.dtypes)
print(data.head())
Manipulando variáveis
1. Criar
Utiliza-se o operador "=" (igual) para atribuir valor a uma variável.
Note: é necessário atribuir novamente o valor à variável data, após apagar as colunas, por isso o "data =" no começo. Também é possível atribuir a uma nova planilha "data2 =".
PARA VISUALIZAÇÃO!
print(data.columns)
3. Selecionar
3.1 Selecionar pelo nome das colunas
Ex:
print(data[['id','price', 'bedrooms']])
Note: "print" serve apenas para mostrar o resultado.
ou
criar variável com lista antes.
cols= ['id','price', 'bedrooms']
selecionar a lista.
print(data[cols])
3.2 Selecionar pelos índices (index) das linhas e das colunas
Forma -> iloc[intervalo de linhas, intervalo de colunas]
Ex:
print(data.iloc[0:5, 0:3])
3.3 Selecionar pelos índices das linhas e pelo nome das colunas
Forma -> loc[intervalo de linhas, nome da coluna/lista]
Ex:
print(data.loc[0:4, ['id','price', 'bedrooms']])
ou
cols= ['id','price', 'bedrooms']
print(data.loc[0:4, cols])
3.4 Selecionar pelos índices booleanos (True, False)
Forma -> precisa ser uma lista de True e False, na mesma quantidade de colunas.