Skip to content
This repository has been archived by the owner on Apr 20, 2023. It is now read-only.

Mise en place d'une architecture permettant d'optimiser les poids #7

Open
pedevineau opened this issue Sep 1, 2022 · 1 comment
Open
Labels
enhancement New feature or request

Comments

@pedevineau
Copy link
Collaborator

pedevineau commented Sep 1, 2022

Mise en place d'une architecture permettant d'optimiser les poids elastic à partir d'une optimisation sur une fonction de coût (par exemple un taux de réussite de la tâche "retrouver les entreprises labellisées en utilisant tout ou partie de l'information disponible).

@pedevineau pedevineau added the enhancement New feature or request label Sep 1, 2022
@pedevineau pedevineau changed the title Mies en place d'une architecture permettant d'optimiser les poids Mise en place d'une architecture permettant d'optimiser les poids Sep 1, 2022
@wgrison
Copy link

wgrison commented Dec 8, 2022

J'ai mis en place un processus qui pourrait répondre aux attentes. La fonction utilise les résultats retournés par Elastic, calcule plusieurs mesures de similarité textuelle (cf. librairie recordlinkage) puis retourne une probabilité d'appariement à partir d'une régression logistique. Le coût est directement calculé à partir de cette probabilité prédite et permet d'optimiser les poids de la fonction de régression. La librairie recordlinkage mentionnée propose une mesure de similarité pour les coordonnées géographiques à l'image d'ElasticSearch. Je me suis aussi demandé pourquoi vous n'utilisiez pas le "geo_score" de la base geo sirene pour déterminer si l'utilisation des données de l'API adresse est pertinente.

Sign up for free to subscribe to this conversation on GitHub. Already have an account? Sign in.
Labels
enhancement New feature or request
Projects
None yet
Development

No branches or pull requests

2 participants