Skip to content

Latest commit

 

History

History
109 lines (76 loc) · 4.03 KB

NumPy.md

File metadata and controls

109 lines (76 loc) · 4.03 KB

Processamento de Dados com NumPy

NumPy é uma biblioteca em Python essencial para ciência de dados, matemática e estatística. Ela fornece uma estrutura de dados poderosa, chamada de array, que permite o armazenamento e a manipulação eficiente de dados numéricos. NumPy é especialmente útil para trabalhar com grandes conjuntos de dados, oferecendo operações rápidas em matrizes e arrays multidimensionais.

1. Introdução ao NumPy

O NumPy (Numerical Python) foi desenvolvido para suportar o processamento de dados em Python e é otimizado para cálculos numéricos e operações vetorizadas, como somas, produtos, cálculos de médias, entre outros. NumPy permite criar arrays multidimensionais, que são semelhantes às listas em Python, mas com operações matemáticas otimizadas.

Para começar a usar o NumPy, você precisa importá-lo, geralmente com o apelido np para facilitar o uso.

import numpy as np

2. Criando Arrays NumPy

Para criar um array NumPy, podemos usar várias funções fornecidas pela biblioteca:

  • np.array(): cria um array a partir de uma lista ou tupla.
  • np.zeros(): cria um array preenchido com zeros.
  • np.ones(): cria um array preenchido com uns.
  • np.arange(): cria um array com uma sequência de números.

Exemplos:

# Criando um array a partir de uma lista
array1 = np.array([1, 2, 3, 4, 5])
print("Array 1:", array1)

# Criando um array de zeros
array2 = np.zeros(5)
print("Array 2:", array2)

# Criando um array de uns
array3 = np.ones((2, 3))
print("Array 3:\n", array3)

# Criando um array com uma sequência de números
array4 = np.arange(0, 10, 2)  # De 0 a 10, com passo de 2
print("Array 4:", array4)

3. Operações com Arrays

NumPy permite realizar operações aritméticas nos arrays de forma vetorizada, o que significa que as operações são aplicadas a cada elemento do array sem precisar de um loop. Isso é muito mais rápido do que usar listas Python normais para grandes conjuntos de dados.

Exemplo:

array = np.array([10, 20, 30, 40])

# Operações aritméticas
print("Array + 2:", array + 2)       # Soma 2 a cada elemento
print("Array * 3:", array * 3)       # Multiplica cada elemento por 3
print("Array / 2:", array / 2)       # Divide cada elemento por 2
print("Array - 5:", array - 5)       # Subtrai 5 de cada elemento

4. Arrays Multidimensionais e Operações em Matrizes

NumPy também permite criar e manipular arrays multidimensionais. Esses arrays são úteis para representar dados em matrizes (por exemplo, dados de imagens ou tabelas).

# Criando uma matriz 2x3
matriz = np.array([[1, 2, 3], [4, 5, 6]])
print("Matriz:\n", matriz)

# Operação: Transposição da matriz
print("Transposta da matriz:\n", matriz.T)

# Operação: Soma de duas matrizes
matriz2 = np.array([[10, 20, 30], [40, 50, 60]])
print("Soma das matrizes:\n", matriz + matriz2)

5. Funções Estatísticas

NumPy oferece diversas funções para cálculo estatístico, como média, desvio padrão, soma, valor máximo e mínimo.

dados = np.array([10, 20, 30, 40, 50])

# Funções estatísticas
print("Média:", np.mean(dados))
print("Desvio padrão:", np.std(dados))
print("Soma:", np.sum(dados))
print("Máximo:", np.max(dados))
print("Mínimo:", np.min(dados))

6. Indexação e Fatiamento

Assim como listas em Python, podemos acessar elementos individuais de arrays NumPy usando índices. Arrays multidimensionais usam uma estrutura de índices similar à de matrizes.

# Exemplo de fatiamento
array = np.array([10, 20, 30, 40, 50])
print("Elementos 1 a 3:", array[1:4])  # Exibe do segundo ao quarto elemento

# Fatiamento em matrizes
matriz = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print("Linha 1:", matriz[0])         # Primeira linha
print("Elemento [1, 2]:", matriz[1, 2]) # Linha 2, Coluna 3

Conclusão

NumPy é uma ferramenta poderosa para análise e processamento de dados em Python. Suas operações vetorizadas e funções avançadas simplificam muito o trabalho com grandes conjuntos de dados.