Skip to content
View paulo-santos-ds's full-sized avatar

Block or report paulo-santos-ds

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Please don't include any personal information such as legal names or email addresses. Maximum 100 characters, markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
paulo-santos-ds/README.md

Quem sou eu

Possuo pós-graduação em Estatística Aplicada e atuo na área de Análise e Ciências de Dados desde o final de 2021. Durante esse período, desenvolvi habilidades em diversas bibliotecas, incluindo Pandas, Numpy, TensorFlow, PySpark e Spark. com Inglês e Espanhol avançado.

Cientista de Dados da TripleTen. No curso aprendi a realizar consultas em SQL e a trabalhar com as principais bibliotecas do Pyhton utilizadas para análise de dados e ciência de dados (pandas, numpy, matplotlib, plotly, scipy, scikit learn, keras), e suas aplicações para manipulação, análises e testes estatísticos, séries temporais, machine learning e resolução de problemas de negócios. Aprendi a construir modelos de machine learning supervisionados e não supervisionados, além de redes totalmente conectadas e redes neurais convolucionais.

Tenho experiência em Python, SQL (BigQuery), análise estatística, criação de dashboards Power Bi, Tableau, Qlik Sense, Ferramentas de ETL Talend e Pentaho, resolução de problemas complexos, comunicação entre áreas, gestão de projetos, automação de processos (pyhton), machine learning e modelagem preditiva.

paulo-santos-ds

  • 🛠️ Trabalhando com análise e visualização de dados: Sistema de recomendação de música para mídia digital

  • 🌱 Atualmente trabalhando com Ciência de dados, Análise Estatística, Análise de Dados

  • 👯 Trabalho como analista de TI

  • 💬 Pergunte-me sobre Ciência de Dados, Análise Estatistica, Análise de Dados, SQL, Power BI, Python, Tableau, QlikSense, Excel

  • 📄 Meu portfólio de Análise de Dados. https://prasds.blogspot.com/

Me encontre:

paulo-roberto-data-science @pras.ds prasds blog

Ferramentas:

Power BI, AWS (Amazon Web Services), Docker, Git, Kubernetes, Linux, Microsoft SQL Server, MySQL, Pandas, Python, Scikit Learn, Seaborn, SQLite, TensorFlow, XGBoost, Qliksense, Tableau,

Power BI aws docker git hadoop kubernetes linux mssql mysql pandas python scikit_learn seaborn sqlite tensorflow xgboost Qlik Sense Tableau

 paulo-santos-dshpaulo-santos-ds

Projetos

Sinta-se à vontade para dar uma olhada nos meus projetos abaixo:

Portfolio de Projetos

Projetos em Machine Learning e Data Science

Nome Projeto Notebook e Link Ferramentas Descrição
Prevendo fraude cartão de credito com regressão logística Fraude_Cartão Python,Pandas, Scikit Learn, Numpy, Seaborn A fraude de cartão de crédito é uma forma comum de golpe que afeta milhões de pessoas em todo o mundo. Essa fraude pode ter consequências graves, tanto para as vítimas quanto para as instituições financeiras que emitem os cartões de crédito.
Teste A-B Testing_A_B Python,Pandas, Scikit Learn, Matplotlib, Statsmodels O propósito do teste A/B é comparar diferentes amostras de conteúdo e design em pares.
Análise Melhores pontos para Poços de Petróleo Poços_Petroleo Python, Pandas, Scikit Learn, Numpy, Seaborn, Matplotlib, Math Este projeto tem como objetivo desenvolver um modelo que possa prever o melhor local para a perfuração de poços de petróleo. Utilizando modelo de machine learning para poder prever o lucro de cada poço.
Previsão de Churn Churn Python, Pandas, Scikit Learn, Numpy, Seaborn, Matplotlib, Math Este projeto tem como objetivo desenvolver um modelo capaz de prever se um cliente está prestes a deixar um banco fictício. Para isso, são analisados dados sobre o comportamento passado dos clientes e rescisões de contratos com o banco.
Análise Planos de Telefonia Plano_Telefonia Python, Pandas, Scikit Learn, Numpy, Seaborn, Matplotlib, Math Este projeto tem como objetivo desenvolver um modelo que possa analisar o comportamento do cliente e recomendar um dos planos mais recentes de uma companhia telefônica fictícia.
Análise Corridas de Taxi Corridas de Taxi Python, Pandas, Scikit Learn, Numpy, Seaborn, Matplotlib, Math Este projeto tem como objetivo analisar os dados de um aplicativo fictício de caronas. Encontrar padrões nas informações disponíveis, entender as preferências dos passageiros e o impacto de fatores externos nas corridas.
Prevendo Preços de carros Preco de carro Python, Pandas, Scikit Learn, Numpy, Seaborn, Matplotlib, Math Este projeto tem como objeivo prever as vendas de carros. A qualidade e velocidade de predições é crucial para o negócio. O projeto utiliza dados históricos, especificações técnicas, versões de acabamento e preços.
Relatorio Operacional de Vendas Dashboard Tableau Tableau, sql Este projeto tem como objetivo analisar os dados de Vendas produtos de escritorio, encontrar padrões nas informações disponíveis, entender as preferências dos clientes e o impacto de fatores externos no consumo.
Relatório de Eficácia de Vendas Dashboard Qlik Sense Qlik Sense, Csv Este projeto visa analisar os dados de vendas de produtos agrícolas, identificando padrões nas informações disponíveis e compreender as preferências dos clientes e o impacto de fatores externos no consumo.
Tradutor texto com google translator Tradutor de texto Python, streamlit, numpy, Deep_translator, pyngrok Um aplicativo web simples de tradução que converte texto do português para o inglês, construído com Streamlit e Google Translator. com este codigo e possivel traduzir texto em diversas idiomas desde que eles sejam compativeis com google translator.
Validação de Cartão de Crédito com Azure e Streamlit validacao de cartão Python, streamlit, azure Este projeto consiste em uma aplicação web que utiliza Azure Computer Vision e Streamlit para verificar e validar informações de cartões de crédito em imagens.
Base nos dados de clientes dados empresa de seguros Companhia de seguros Python, Pandas, Sklearn, Seaborn,Matplotlib, Math A empresa companhia de seguros Proteja Seu Amanhã determinou este projeto para responder a perguntas de negócios utilizando técnicas de machine learning. O objetivo é gerar insights valiosos para a empresa com base nos dados dos clientes, apoiando a tomada de decisões estratégicas.
Guia de Preços de Veiculos Usados com Machine Learn Preço de veiculos Python, Pandas, Sklearn, Seaborn,Matplotlib, Math, lightgbm, Catboost Desenvolvimento de um modelo para o serviço de vendas de carros usados Rusty Bargain, com o objetivo de estimar rapidamente o valor de mercado de veículos. O modelo foi projetado para determinar de forma precisa e eficiente o preço justo de cada carro, otimizando o processo de compra e venda.
Previsao Total Corridas Taxi Proxima Hora Previsao Corrida de Taxi Python, Pandas, Sklearn, Seaborn,Matplotlib, numpy, statsmodels Foi desenvolvido um modelo preditivo específico para atrair mais motoristas durante o horário de pico. Prever a quantidade de pedidos de táxi para a próxima hora.
Este projeto visa desenvolver um sistema para filtrar e categorizar resenhas de filmes criticas_de_filmes Python, Pandas, Sklearn, Seaborn,Matplotlib, numpy, nltk, spacy, lgbm Este projeto visa desenvolver um sistema para filtrar e categorizar resenhas de filmes. O objetivo é treinar um modelo de Aprendizado de Máquina para detectar automaticamente resenhas negativas, utilizando um conjunto de dados de resenhas de filmes do IMDB com rotulagem de polaridade (positiva ou negativa).
Será desenvolvido um modelo capaz de identificar precocemente clientes com maior probabilidade de cancelamento Rotatividade de clientes Python, Pandas, Sklearn, Seaborn,Matplotlib, numpy, catboost A operadora de comunicações InternetGO está interessada em prever a rotatividade de seus clientes (churn). Se for identificado que um usuário está planejando trocar de operadora, a empresa poderá oferecer códigos promocionais e opções de planos especiais para evitar a perda desse cliente.
Análise detalhada sobre o desempenho das músicas e dos artistas top 200 artistas musicais Python, Pandas, Sklearn, Power bi Este dashboard oferece uma análise detalhada sobre o desempenho das músicas e dos artistas, baseado nas horas escutadas por gênero musical, região e outros critérios. Ele é útil para compreender as preferências musicais dos ouvintes, tendências regionais e o impacto de artistas específicos.

Pinned Loading

  1. Deep-Learning Deep-Learning Public

  2. Estatistica Estatistica Public

    Jupyter Notebook

  3. Machine-Learning Machine-Learning Public

    Jupyter Notebook

  4. MachineLearningLogisticRegression MachineLearningLogisticRegression Public

    A fraude de cartão de crédito é uma forma comum de fraude que afeta milhões de pessoas em todo o mundo. Essa fraude pode ter consequências graves, tanto para as vítimas quanto para as instituições …

    Jupyter Notebook

  5. Projects Projects Public

    Jupyter Notebook

  6. webScraping webScraping Public

    Jupyter Notebook