Skip to content

Latest commit

 

History

History
10 lines (6 loc) · 471 Bytes

README.md

File metadata and controls

10 lines (6 loc) · 471 Bytes

Résumé

Ce repo permet de réaliser des recherches vectorielles (vector search) sur les titres et descriptions des jeux de données présents sur data.gouv.fr.

La base d'embeddings doit être générée en lançant load.py une première fois (sur un ordinateur portable 4 cœurs, 2h30 avec l'embedding actuel).

Les requêtes se font avec query.py.

Screenshot