Skip to content

Repo del Curso "Acceso a Información Relevante en la Era de los Datos Masivos" (CACIC 2023)

Notifications You must be signed in to change notification settings

tolosoft/CACIC2023_AIREDM

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

28 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Curso: "Acceso a Información Relevante en la Era de los Datos Masivos" (CACIC 2023)

Repo del Curso "Acceso a Información Relevante en la Era de los Datos Masivos" de la Escuela de Informática de [CACIC 2023]

Este repositorio contiene notebooks Python con ejemplos y ejercicios que cubren cada una de las clases.

Introducción

Este curso presenta algunas de las técnicas actuales detrás de las aplicaciones de búsqueda de escala web que se utilizan diariamente (considerando tanto eficacia como eficiencia). Se abordan temas de procesamiento de textos usando tecnologías del lenguaje. Se propone un enfoque práctico donde cada día se prueben en código algunas de las ideas presentadas. Las clases están divididas en cuatro temas:

Setup

Clonar este repo:

$ git clone https://github.com/tolosoft/CACIC2023_AIREDM.git

Ejecutar la siguiente imagen de Docker (la primera vez se descarga de Docker Hub):

$ docker run -p 8888:8888 -e GRANT_SUDO=yes --user 1001:100 -w /home/jovyan -v "/home/alumno:/home/jovyan/" tolosoft/cacic_airedm:latest

La misma está basada en jupyter/base-notebook (https://hub.docker.com/r/jupyter/base-notebook) y contiene todas la librerías necesarias para ejecutar los ejemplos del curso. Para reconstruir la imagen desde cero, editar y usar el Dockerfile que se encuentra en ./docker

About

Repo del Curso "Acceso a Información Relevante en la Era de los Datos Masivos" (CACIC 2023)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published