- NumPy: Biblioteca fundamental para computação científica em Python, fornece suporte para arrays e matrizes multidimensionais, além de uma grande coleção de funções matemáticas de alto desempenho.
- Pandas: Ferramenta para análise e manipulação de dados, especialmente útil para trabalhar com tabelas de dados estruturados, fornecendo estruturas de dados como DataFrames.
- SciPy: Biblioteca de computação científica que complementa o NumPy, oferecendo ferramentas para otimização, integração, interpolação, álgebra linear, estatísticas e muito mais.
- Dask: Extensão do NumPy e Pandas para computação distribuída e paralela, permite processamento de grandes conjuntos de dados que não cabem na memória.
- Xarray: Biblioteca para trabalhar com dados multidimensionais rotulados, como dados climáticos, dados espaciais e outros dados científicos.
- Matplotlib: Biblioteca padrão para criação de gráficos e visualização de dados em Python, amplamente usada em ciência de dados e pesquisa científica.
- Seaborn: Biblioteca baseada no Matplotlib, voltada para visualização de dados estatísticos, com gráficos pré-configurados para fácil análise e interpretação.
- Plotly: Ferramenta para criar gráficos interativos e visualizações em 3D, muito usada para visualizações científicas complexas.
- Bokeh: Biblioteca para visualização de dados interativa e web, permite a criação de gráficos dinâmicos e dashboards científicos.
- Pygal: Biblioteca para criar gráficos SVG, ideal para visualizações leves e escaláveis para a web.
- scikit-learn: Ferramenta essencial para aprendizado de máquina, fornece uma ampla gama de algoritmos de classificação, regressão e clustering, além de funções de pré-processamento.
- TensorFlow: Framework de aprendizado profundo criado pelo Google, utilizado para construir e treinar redes neurais complexas.
- PyTorch: Biblioteca de aprendizado profundo desenvolvida pelo Facebook, amplamente usada para pesquisa e desenvolvimento em redes neurais e aprendizado de máquina.
- Keras: API de alto nível para redes neurais que roda sobre TensorFlow, fácil de usar e popular para prototipagem rápida de modelos de aprendizado profundo.
- Statsmodels: Biblioteca para análise estatística e econometria, útil para modelagem estatística avançada e testes de hipóteses.
- OpenCV: Biblioteca para processamento de imagens e visão computacional, utilizada para manipulação de imagens, vídeos e visão computacional em geral.
- scikit-image: Biblioteca para processamento de imagens com uma variedade de algoritmos de análise e manipulação.
- imageio: Biblioteca para leitura e gravação de uma ampla gama de formatos de imagens, além de manipulação de vídeos.
- PyWavelets: Biblioteca para análise de wavelets, utilizada no processamento de sinais, compressão de dados e remoção de ruído.
- Soundfile: Ferramenta para manipulação de ficheiros de áudio, útil para análise de sinais de som.
- SymPy: Biblioteca para matemática simbólica, oferece ferramentas para manipulação e resolução de expressões algébricas, cálculo simbólico e operações matemáticas avançadas.
- Statsmodels: Voltada para análise estatística, inclui ferramentas para modelagem e testes estatísticos, análise de séries temporais e econometria.
- PyMC3: Biblioteca para modelagem probabilística bayesiana, utilizada em modelos estatísticos complexos e inferência bayesiana.
- scipy.stats: Submódulo do SciPy dedicado a funções estatísticas e distribuições de probabilidade, útil para realizar testes estatísticos e análise de dados.
- NLTK: Biblioteca para processamento de linguagem natural, oferece ferramentas para análise de texto, tokenização, stemming, lematização e análise sintática.
- spaCy: Biblioteca avançada para processamento de linguagem natural, muito rápida e eficiente, com funcionalidades de análise de dependência, NER (Reconhecimento de Entidades Nomeadas) e vetorização de texto.
- Gensim: Biblioteca para modelagem de tópicos, transformação de textos e análise semântica, amplamente utilizada para análise de documentos e construção de modelos de tópicos.
- TextBlob: Biblioteca para tarefas básicas de NLP, incluindo análise de sentimentos, classificação de texto e extração de recursos.
- Dask: Permite a execução de computação distribuída e paralela, útil para processar grandes quantidades de dados.
- Joblib: Biblioteca para paralelização em tarefas de ciência de dados, usada para execução eficiente de loops e pipelines paralelizados.
- Ray: Plataforma para desenvolvimento de aplicações distribuídas, ideal para trabalhos em machine learning e processamento de dados de larga escala.
- Biopython: Conjunto de ferramentas para bioinformática, oferece funções para análise de sequências biológicas, manipulação de ficheiros e estruturas moleculares.
- Astropy: Biblioteca para astronomia, com ferramentas para análise de dados astronômicos, manipulação de coordenadas e simulação de fenômenos espaciais.
- geopandas: Extensão do Pandas para análise de dados geoespaciais, permite manipulação de dados geográficos e realização de análises espaciais.
- ChemPy: Biblioteca para química computacional, oferece funcionalidades para simulação de reações químicas, cinética e análise de equilíbrio químico.
- Pint: Módulo para manipulação de unidades físicas, permitindo realizar cálculos com unidades de medida.