Skip to content

Latest commit

 

History

History
28 lines (18 loc) · 1.46 KB

README.md

File metadata and controls

28 lines (18 loc) · 1.46 KB

Atividades da Disciplina de CI1030

Disciplina: Ciência de Dados para Segurança (CI1030)

Curso: Bacharelado em Ciência da Computação - Universidade Federal do Paraná (UFPR)

Professor: André Ricardo Abed Gregio

Participantes:

Descrição

  • Este repositório tem como função abrigar as tarefas proposta pela matéria de Ciência de Dados para Segurança (CI1030) da Universiade Federal do Paraná (2021/2o Semestre (ERE5) - feito em 2022)

  • As tarefas consistem em atividades como:

    • Tratamento de um dataset de URLs utilizando Pandas (Python e Python Notebooks)
    • Treinamento de modelos de aprendizado de máquina utilizando features extraidas das URLs
    • Tentativa de caracterização de URLs como Maliciosas ou Não Maliciosas utilizando as features extraidas
    • Vizualização dos resultados e da distribuição dos dados utilizando diversas ferramentas (WEKA, gráfico scatterplot)
  • Cada Pasta desse respositório tem um README.md contendo informações extras sobre as atividades, sendo a Tarefa 2 a própria criação desse repositório

Dependências

  • Para rodar os scripts, é necessário ter o Python instalado, assim como as bibliotecas necessárias, presente no arquivo requirements.txt de cada diretório
  • Para rodar os Python Notebooks, é necessário um ambiente capaz de rodalos, recomendo a interface do Visual Studio Code