Skip to content

Latest commit

 

History

History
61 lines (45 loc) · 5.93 KB

modulos-cientificos.md

File metadata and controls

61 lines (45 loc) · 5.93 KB

Módulos Científicos em Python

1. Análise e Manipulação de Dados

  • NumPy: Biblioteca fundamental para computação científica em Python, fornece suporte para arrays e matrizes multidimensionais, além de uma grande coleção de funções matemáticas de alto desempenho.
  • Pandas: Ferramenta para análise e manipulação de dados, especialmente útil para trabalhar com tabelas de dados estruturados, fornecendo estruturas de dados como DataFrames.
  • SciPy: Biblioteca de computação científica que complementa o NumPy, oferecendo ferramentas para otimização, integração, interpolação, álgebra linear, estatísticas e muito mais.
  • Dask: Extensão do NumPy e Pandas para computação distribuída e paralela, permite processamento de grandes conjuntos de dados que não cabem na memória.
  • Xarray: Biblioteca para trabalhar com dados multidimensionais rotulados, como dados climáticos, dados espaciais e outros dados científicos.

2. Visualização de Dados

  • Matplotlib: Biblioteca padrão para criação de gráficos e visualização de dados em Python, amplamente usada em ciência de dados e pesquisa científica.
  • Seaborn: Biblioteca baseada no Matplotlib, voltada para visualização de dados estatísticos, com gráficos pré-configurados para fácil análise e interpretação.
  • Plotly: Ferramenta para criar gráficos interativos e visualizações em 3D, muito usada para visualizações científicas complexas.
  • Bokeh: Biblioteca para visualização de dados interativa e web, permite a criação de gráficos dinâmicos e dashboards científicos.
  • Pygal: Biblioteca para criar gráficos SVG, ideal para visualizações leves e escaláveis para a web.

3. Machine Learning e Inteligência Artificial

  • scikit-learn: Ferramenta essencial para aprendizado de máquina, fornece uma ampla gama de algoritmos de classificação, regressão e clustering, além de funções de pré-processamento.
  • TensorFlow: Framework de aprendizado profundo criado pelo Google, utilizado para construir e treinar redes neurais complexas.
  • PyTorch: Biblioteca de aprendizado profundo desenvolvida pelo Facebook, amplamente usada para pesquisa e desenvolvimento em redes neurais e aprendizado de máquina.
  • Keras: API de alto nível para redes neurais que roda sobre TensorFlow, fácil de usar e popular para prototipagem rápida de modelos de aprendizado profundo.
  • Statsmodels: Biblioteca para análise estatística e econometria, útil para modelagem estatística avançada e testes de hipóteses.

4. Processamento de Sinais e Imagem

  • OpenCV: Biblioteca para processamento de imagens e visão computacional, utilizada para manipulação de imagens, vídeos e visão computacional em geral.
  • scikit-image: Biblioteca para processamento de imagens com uma variedade de algoritmos de análise e manipulação.
  • imageio: Biblioteca para leitura e gravação de uma ampla gama de formatos de imagens, além de manipulação de vídeos.
  • PyWavelets: Biblioteca para análise de wavelets, utilizada no processamento de sinais, compressão de dados e remoção de ruído.
  • Soundfile: Ferramenta para manipulação de ficheiros de áudio, útil para análise de sinais de som.

5. Estatística e Probabilidade

  • SymPy: Biblioteca para matemática simbólica, oferece ferramentas para manipulação e resolução de expressões algébricas, cálculo simbólico e operações matemáticas avançadas.
  • Statsmodels: Voltada para análise estatística, inclui ferramentas para modelagem e testes estatísticos, análise de séries temporais e econometria.
  • PyMC3: Biblioteca para modelagem probabilística bayesiana, utilizada em modelos estatísticos complexos e inferência bayesiana.
  • scipy.stats: Submódulo do SciPy dedicado a funções estatísticas e distribuições de probabilidade, útil para realizar testes estatísticos e análise de dados.

6. Processamento de Texto e NLP (Processamento de Linguagem Natural)

  • NLTK: Biblioteca para processamento de linguagem natural, oferece ferramentas para análise de texto, tokenização, stemming, lematização e análise sintática.
  • spaCy: Biblioteca avançada para processamento de linguagem natural, muito rápida e eficiente, com funcionalidades de análise de dependência, NER (Reconhecimento de Entidades Nomeadas) e vetorização de texto.
  • Gensim: Biblioteca para modelagem de tópicos, transformação de textos e análise semântica, amplamente utilizada para análise de documentos e construção de modelos de tópicos.
  • TextBlob: Biblioteca para tarefas básicas de NLP, incluindo análise de sentimentos, classificação de texto e extração de recursos.

7. Computação Paralela e Distribuída

  • Dask: Permite a execução de computação distribuída e paralela, útil para processar grandes quantidades de dados.
  • Joblib: Biblioteca para paralelização em tarefas de ciência de dados, usada para execução eficiente de loops e pipelines paralelizados.
  • Ray: Plataforma para desenvolvimento de aplicações distribuídas, ideal para trabalhos em machine learning e processamento de dados de larga escala.

8. Outros Módulos Científicos

  • Biopython: Conjunto de ferramentas para bioinformática, oferece funções para análise de sequências biológicas, manipulação de ficheiros e estruturas moleculares.
  • Astropy: Biblioteca para astronomia, com ferramentas para análise de dados astronômicos, manipulação de coordenadas e simulação de fenômenos espaciais.
  • geopandas: Extensão do Pandas para análise de dados geoespaciais, permite manipulação de dados geográficos e realização de análises espaciais.
  • ChemPy: Biblioteca para química computacional, oferece funcionalidades para simulação de reações químicas, cinética e análise de equilíbrio químico.
  • Pint: Módulo para manipulação de unidades físicas, permitindo realizar cálculos com unidades de medida.