analyse-R/graphiques-bivaries-ggplot2 #177
Replies: 9 comments 15 replies
-
Très instructif. |
Beta Was this translation helpful? Give feedback.
-
Bonsoir tout le monde , veuillez m'aidez à éclaircir ces points suivants SVP. J'ai une question concernant la régression logistique. Lors de l'enquête chez les agriculteurs pour l'obtention de nos données, les données concernant l'âge et la taille de leurs exploitations on été recueillies par tranche qu'on a ensuite codées dans Excel par des chiffres comme suit ex: 20-29 ans --->1, 30-39 ans --->2 Jusqu'à un échelle de 5, même chose pour la taille de la ferme : moins de 1 ha --->1, 2-5 ha --->2 ainsi de suite jusqu'à échelle de 4. Le même pour le niveau d'étude. 1)Pourquoi quand j'essaie de faire le recode dans R en remplaçant les chiffre par les labels , ces variables sont toujours considérées comme des facteurs et que j'ai pas de statistiques descriptives concernant la moyenne et l'écart type ? Quand j'essaie de forcé les statistiques comme j'ai vu dans les vidéos (web-in R ) en les considérants comme variables numéric continues , j'ai des chiffres sur la moyenne et l'écart type qui sont calculés sur la base du codage ( 1, 2 ,3, 5) et son difficile à interpréter pour moi. Le problème est que même si j'essaie de faire le grouper les âges et la taille de la ferme dans R avec ( numéric rang...) c'est très difficile puisque les intervalles qui me sont proposées, part de 1 à 5 . De toute façon je souhaite analyser l'effet continu de l'âge, la taille d'exploitation, le niveau d'étude sur ma la probabilité d'apparition de l'événement.
Cordialement |
Beta Was this translation helpful? Give feedback.
-
Bonsoir. Par rapport à ta préoccupation, je pense que le problème se trouve
au niveau du questionnaire déjà. Pour obtenir ce que tu veux, il ne fallait
pas regrouper en classe déjà dès le départ, mais plutôt prendre les valeurs
de l'âge pas à part pour chaque agriculteurs. Le regroupement en classe ne
peut te permettre d'avoir une moyenne ou un écart-type, mais plutôt une
classe modale. En essayant de forcer dans R, tu auras des résultats
erronées. J'espère avoir bien compris ta préoccupation.
…On Fri, Aug 18, 2023, 6:24 PM Mamadou40 ***@***.***> wrote:
Bonsoir tout le monde , veuillez m'aidez à éclaircir ces points suivants
SVP.
J'ai une question concernant la régression logistique.
Lors de l'enquête chez les agriculteurs pour l'obtention de nos données,
les données concernant l'âge et la taille de leurs exploitations on été
recueillies par tranche qu'on a ensuite codées dans Excel par des chiffres
comme suit ex: 20-29 ans --->1, 30-39 ans --->2 Jusqu'à un échelle de 5,
même chose pour la taille de la ferme : moins de 1 ha --->1, 2-5 ha --->2
ainsi de suite jusqu'à échelle de 4. Le même pour le niveau d'étude.
1)Pourquoi quand j'essaie de faire le recode dans R en remplaçant les
chiffre par les labels , ces variables sont toujours considérées comme des
facteurs et que j'ai pas de statistiques descriptives concernant la moyenne
et l'écart type ? Quand j'essaie de forcé les statistiques comme j'ai vu
dans les vidéos (web-in R ) en les considérants comme variables numéric
continues , j'ai des chiffres sur la moyenne et l'écart type qui sont
calculés sur la base du codage ( 1, 2 ,3, 5) et son difficile à interpréter
pour moi.
Le problème est que même si j'essaie de faire le grouper les âges et la
taille de la ferme dans R avec ( numéric rang...) c'est très difficile
puisque les intervalles qui me sont proposées, part de 1 à 5 .
De toute façon je souhaite analyser l'effet continu de l'âge, la taille
d'exploitation, le niveau d'étude sur ma la probabilité d'apparition de
l'événement.
1. est-ce que si je fais la régression logistique sur la base de mon
codage sur excel, ça n'impactera pas les résultats ?
Cordialement
—
Reply to this email directly, view it on GitHub
<#177 (comment)>,
or unsubscribe
<https://github.com/notifications/unsubscribe-auth/APQJHWGPOY4ZNXEXP7GDODLXV6QMRANCNFSM6AAAAAA23DEORU>
.
You are receiving this because you commented.Message ID:
***@***.***>
|
Beta Was this translation helpful? Give feedback.
-
S'agissant de la régression logistique, il y a une autre manière de recoder
que je peux te proposer. Il s'agira de transformer chaque classe en une
variable dichotomique. Ce sera 0 si l'individu appartient à la classe et 1
sinon. L'interprétation sera plus aisé.
On Sat, Aug 19, 2023, 1:37 AM Joao BABADOUDOU ***@***.***>
wrote:
… Bonsoir. Par rapport à ta préoccupation, je pense que le problème se
trouve au niveau du questionnaire déjà. Pour obtenir ce que tu veux, il ne
fallait pas regrouper en classe déjà dès le départ, mais plutôt prendre les
valeurs de l'âge pas à part pour chaque agriculteurs. Le regroupement en
classe ne peut te permettre d'avoir une moyenne ou un écart-type, mais
plutôt une classe modale. En essayant de forcer dans R, tu auras des
résultats erronées. J'espère avoir bien compris ta préoccupation.
On Fri, Aug 18, 2023, 6:24 PM Mamadou40 ***@***.***> wrote:
> Bonsoir tout le monde , veuillez m'aidez à éclaircir ces points suivants
> SVP.
>
> J'ai une question concernant la régression logistique.
>
> Lors de l'enquête chez les agriculteurs pour l'obtention de nos données,
> les données concernant l'âge et la taille de leurs exploitations on été
> recueillies par tranche qu'on a ensuite codées dans Excel par des chiffres
> comme suit ex: 20-29 ans --->1, 30-39 ans --->2 Jusqu'à un échelle de 5,
> même chose pour la taille de la ferme : moins de 1 ha --->1, 2-5 ha --->2
> ainsi de suite jusqu'à échelle de 4. Le même pour le niveau d'étude.
>
> 1)Pourquoi quand j'essaie de faire le recode dans R en remplaçant les
> chiffre par les labels , ces variables sont toujours considérées comme des
> facteurs et que j'ai pas de statistiques descriptives concernant la moyenne
> et l'écart type ? Quand j'essaie de forcé les statistiques comme j'ai vu
> dans les vidéos (web-in R ) en les considérants comme variables numéric
> continues , j'ai des chiffres sur la moyenne et l'écart type qui sont
> calculés sur la base du codage ( 1, 2 ,3, 5) et son difficile à interpréter
> pour moi.
>
> Le problème est que même si j'essaie de faire le grouper les âges et la
> taille de la ferme dans R avec ( numéric rang...) c'est très difficile
> puisque les intervalles qui me sont proposées, part de 1 à 5 .
>
> De toute façon je souhaite analyser l'effet continu de l'âge, la taille
> d'exploitation, le niveau d'étude sur ma la probabilité d'apparition de
> l'événement.
>
> 1. est-ce que si je fais la régression logistique sur la base de mon
> codage sur excel, ça n'impactera pas les résultats ?
>
> Cordialement
>
> —
> Reply to this email directly, view it on GitHub
> <#177 (comment)>,
> or unsubscribe
> <https://github.com/notifications/unsubscribe-auth/APQJHWGPOY4ZNXEXP7GDODLXV6QMRANCNFSM6AAAAAA23DEORU>
> .
> You are receiving this because you commented.Message ID:
> ***@***.***>
>
|
Beta Was this translation helpful? Give feedback.
-
Pour le codage, tu peux le faire dans R comme dans excel. Il y a les
fonctions de dplyr qui peuvent te faciliter la tâche. Tu dois garder
d'abord les classes pour la statistique descriptive univariée. Il faut
sortir le bar chart, la classe modale, tu peux aussi faire la boîte à
moustache pour chaque classe. C'est une fois terminé que tu passes au
recodage pour la régression logistique. Tu peux atteindre ton objectif pour
la régression avec ça.
…On Sat, Aug 19, 2023, 6:23 AM Mamadou40 ***@***.***> wrote:
Ok. Dans ce cas , je dois refaire ce codage dans ma base de données excel?
Parce que sur R , je sais pas comment le faire( juste un débutant qui
s'applique).
Est-ce que je peux avoir une idée à quoi m'attendre au niveau des
statistiques descriptives univariées ?
Parce que dans la régression j'essaie de voir l'effet continu de l'âge et
la taille de l'exploitation sur la probabilité d'adoption d'un outil de
service agricole .
Cordialement
—
Reply to this email directly, view it on GitHub
<#177 (reply in thread)>,
or unsubscribe
<https://github.com/notifications/unsubscribe-auth/APQJHWGJ3NJEOXJ7KA7QLTDXWBEVZANCNFSM6AAAAAA23DEORU>
.
You are receiving this because you commented.Message ID:
***@***.***>
|
Beta Was this translation helpful? Give feedback.
-
Je vous en prie.
…On Sat, Aug 19, 2023, 11:28 AM Mamadou40 ***@***.***> wrote:
Je vais essayer ça .Merci beaucoup pour votre aide
—
Reply to this email directly, view it on GitHub
<#177 (reply in thread)>,
or unsubscribe
<https://github.com/notifications/unsubscribe-auth/APQJHWCD7545G2CGFSRKCVDXWCIMJANCNFSM6AAAAAA23DEORU>
.
You are receiving this because you commented.Message ID:
***@***.***>
|
Beta Was this translation helpful? Give feedback.
-
Bonjour Mr Larmarange, Encore merci pour votre super site!! J'aurais une question pour les boites à moustaches avec ggplot/geom_boxplot... comment peut on créer plusieurs types de boites à moustaches sur le même graphe quand on a la même échelle en ordonnée. Timothée |
Beta Was this translation helpful? Give feedback.
-
Bonjour, j'aurais une autre question plus importante que la précédente... est-ce que quelqu'un sait faire des diagramme en bâtons / histogrammes avec ggplot mais avec plusieurs variables discrètes càd on rentre en abscisse les données de plusieurs colonnes différentes mais c'est toujours effectif (ou plutôt pourcentage) qui s'affiche en ordonné car sur la même cohorte avec le même nombre total ??? C'est très facile avec Excel mais pas si simple avec R je trouve... merci bien du retour :) |
Beta Was this translation helpful? Give feedback.
-
Super ça fonctionne !! |
Beta Was this translation helpful? Give feedback.
-
analyse-R/graphiques-bivaries-ggplot2
https://larmarange.github.io/analyse-R/graphiques-bivaries-ggplot2.html
Beta Was this translation helpful? Give feedback.
All reactions