-
Notifications
You must be signed in to change notification settings - Fork 5
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
👪 CLUSTERING: toujours ajouter parents existants des acteurs types #1268
👪 CLUSTERING: toujours ajouter parents existants des acteurs types #1268
Conversation
1 remarque suite à la lecture de la PR et avant relecture du code :
On peut considérer que les parents sont liés à toutes les sources des leur enfants -> cela est certainement à prendre en compte lors de la création de cluster pour éviter le cas de cluster avec plusieurs enfants de la même source |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
👪 CLUSTERING: toujours ajouter parents existants des acteurs types
Carte Notion : CLUSTERING: toujours ajouter parents existants des acteurs types
include_acteur_type_codes
), indépendemment de tous les autres critères de sélection des acteurs, les parents en question étant combiné aux acteurs sélectionnéscluster_acteurs_selection_acteur_type_parents
: nouvelle fonction qui vient chercher les parents qui correspondent àinclude_acteur_type_codes
(mais sur la base des IDs déjà validés par la config)include_parents_only_if_regex_matches_nom
à la fonction ci-dessus qui permet d'appliquer une regex, identique OU différente (en fonction besoins métiers) à la sélection parentℹ️ Exemple
Le métier essaye de clusteriser 1 nouvelle source (
include_source_codes=["mysource"]
) sur le type commerce (include_acteur_type_codes=["commerce"]
) avec potentiellement tout un tas de critère de sélections (filtre sur le nom, champs siret non-vides etc...):"commerce"
"mysource"
de type"commerce"
"mysource"
aux parents existant🙏 Be honest with yourself
On peut tout à fait considérer cette PR comme un bugfix d'une idiotie de ma part: par définition un parent n’ayant pas de source, donc on ne pouvait jamais en l'état clusteriser avec les parents existants...
🆕 Pourquoi une nouvelle fonction?
Pour
cluster_acteurs_selection_acteur_type_parents
on serait tenté de réutiliser la fonction existante de sélection des acteurs. Mais en réfléchissant on se dit que:Donc on voit bien que acteurs & parents sont par nature divergents et de chercher à les sélectionner avec la même fonction va rendre la fonction trop conditionnelle/complexe à maintenir, d'où 1 fonction pour acteurs, 1 autre fonction pour parents
Exemple: on souhaite clusteriser les acteurs sans SIRET, on ne veut surtout pas exclure les parents sans SIRET