Disciplina: Ciência de Dados para Segurança (CI1030)
Curso: Bacharelado em Ciência da Computação - Universidade Federal do Paraná (UFPR)
Professor: André Ricardo Abed Gregio
Participantes:
-
Este repositório tem como função abrigar as tarefas proposta pela matéria de Ciência de Dados para Segurança (CI1030) da Universiade Federal do Paraná (2021/2o Semestre (ERE5) - feito em 2022)
-
As tarefas consistem em atividades como:
- Tratamento de um dataset de URLs utilizando Pandas (Python e Python Notebooks)
- Treinamento de modelos de aprendizado de máquina utilizando features extraidas das URLs
- Tentativa de caracterização de URLs como Maliciosas ou Não Maliciosas utilizando as features extraidas
- Vizualização dos resultados e da distribuição dos dados utilizando diversas ferramentas (WEKA, gráfico scatterplot)
-
Cada Pasta desse respositório tem um
README.md
contendo informações extras sobre as atividades, sendo a Tarefa 2 a própria criação desse repositório
- Para rodar os scripts, é necessário ter o Python instalado, assim como as bibliotecas necessárias, presente no arquivo
requirements.txt
de cada diretório - Para rodar os Python Notebooks, é necessário um ambiente capaz de rodalos, recomendo a interface do Visual Studio Code