Skip to content

Repositorio com os exercícios da disciplina CI1030 - Ciência de Dados para Segurança

Notifications You must be signed in to change notification settings

ChristianDPO/CDS-CI1030-ATIVIDADES

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

59 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Atividades da Disciplina de CI1030

Disciplina: Ciência de Dados para Segurança (CI1030)

Curso: Bacharelado em Ciência da Computação - Universidade Federal do Paraná (UFPR)

Professor: André Ricardo Abed Gregio

Participantes:

Descrição

  • Este repositório tem como função abrigar as tarefas proposta pela matéria de Ciência de Dados para Segurança (CI1030) da Universiade Federal do Paraná (2021/2o Semestre (ERE5) - feito em 2022)

  • As tarefas consistem em atividades como:

    • Tratamento de um dataset de URLs utilizando Pandas (Python e Python Notebooks)
    • Treinamento de modelos de aprendizado de máquina utilizando features extraidas das URLs
    • Tentativa de caracterização de URLs como Maliciosas ou Não Maliciosas utilizando as features extraidas
    • Vizualização dos resultados e da distribuição dos dados utilizando diversas ferramentas (WEKA, gráfico scatterplot)
  • Cada Pasta desse respositório tem um README.md contendo informações extras sobre as atividades, sendo a Tarefa 2 a própria criação desse repositório

Dependências

  • Para rodar os scripts, é necessário ter o Python instalado, assim como as bibliotecas necessárias, presente no arquivo requirements.txt de cada diretório
  • Para rodar os Python Notebooks, é necessário um ambiente capaz de rodalos, recomendo a interface do Visual Studio Code