-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathdocsetup.Rmd
105 lines (70 loc) · 4.83 KB
/
docsetup.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
---
title: "Untitled"
author: "KOULOU crepin"
date: "2024-07-05"
output: word_document
always_allow_html: true
---
```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
```
## Importation des packages et de la base de données
```{r message=FALSE}
library(ggplot2)
library(tidyverse)
library(knitr)
library(plotly)
```
La base de données renseigne sur les violences faites aux femmes et quelques caracteristiques relatives a ces femmes notamment : le niveau d'education,l'emploie,le statut matrimonial,et la situation de la femmes en terme de violence subit
```{r message=FALSE}
data<-read_csv('Domestic violence.csv')
kable(head(data))
```
## Analyse univarée de la base de données
### Répartition des ages
```{r}
ggplot(data,aes(x=Age)) + geom_histogram(fill="green") + labs(y="Effectifs",title = "Répartition des ages") + theme(plot.title = element_text(hjust = 0.5,face = "bold"),axis.text.x = element_text(size = 10),axis.text.y = element_text(size = 10),axis.title.y=element_text(vjust = 2.5))
```
On remarque que la plupar des femmes interviewé ont entre 20 et 30 ans.
### Répartition du niveau d'étude
```{r}
data_niv<-data %>% group_by(Education) %>% summarise(Effectif=n())
ggplot(data_niv,aes(x=Education,y=Effectif,fill=Education)) + geom_bar(stat = "identity") + geom_text(aes(label=Effectif),position = position_stack(vjust = 1.05),col="blue") +coord_flip()
```
La majorite des femmes ont arreté l'ecole entre le primaire et le segondaire.En effet comme le montre le graphiuqe ci-dessus, sur 347 femme 132 femmes ont un niveau d'etude primaire contre 114 au secondaire.
### Répartition des revenus des femmes
```{r}
ggplot(data,aes(x=Income)) + geom_boxplot()
```
```{r}
print(length(boxplot(data$Income)$out))
```
On note que la plupart des femmes n'ont pas de revenu. En effet une inspection de la repartition des salaire par femmes revèle que sur les 347 femmes seulement 75 femmes soit 21.61% seulement ont un revenu remarquable de l'ensemble des femmes retenu pour l'etude.
### Répartition du status matrimonial
```{r}
data %>% group_by(`Marital status`) %>% summarise(Effectif=n()) %>% plot_ly( labels = ~`Marital status`, values = ~Effectif, type = 'pie', hole=0.4 ) %>% layout( title = "Répartition du status matrimonial", xaxis = list(showgrid = FALSE, zeroline = FALSE, showticklabels = FALSE), yaxis = list(showgrid = FALSE, zeroline = FALSE, showticklabels = FALSE), showlegend = TRUE, legend = list( orientation = "h", x = 0.5, xanchor = "center", y = -0.1 ) )
```
86.5% des femmes soit 300 sur 347 sont mariées contre seulement 13.5 qui ne le sont pas.
## Répartition des violences faites au femmes
```{r}
data %>% group_by(Violence) %>% summarise(Effectif=n()) %>% plot_ly( labels = ~Violence, values = ~Effectif, type = 'pie', hole=0.4 ) %>% layout( title = "Répartition des violences envers les femmes", xaxis = list(showgrid = FALSE, zeroline = FALSE, showticklabels = FALSE), yaxis = list(showgrid = FALSE, zeroline = FALSE, showticklabels = FALSE), showlegend = TRUE, legend = list( orientation = "h", x = 0.5, xanchor = "center", y = -0.1 ) )
```
indépendament de leurs situation matrimonial actuelle 75.2 % des femmes ont déja ete violenté contre 24.8 % qui n'ont pas subit de violence quelcquonque.
## Analyse bivariée
### Répartition des ages par types de violences subit par les femmes
```{r message=FALSE, warning=FALSE}
ggplotly(ggplot(data,aes(x=Age,fill=Violence)) +geom_histogram() + labs(title="Répartition des ages par types de violences subit par les femmes",y="Effectifs") + theme(plot.title = element_text(hjust = 0.5)))
```
le profils des femmes independament du type de violence subit es presque identique.Par ailleurs ont note plus de femmes entre 20 et 30 ans.
```{r}
ggplot(data,aes(x=Income,fill=Violence)) +geom_histogram() + labs(title="Répartition du Revenu par types de violences subit par les femmes",y="Effectifs") + theme(plot.title = element_text(hjust = 0.5))
```
```{r}
a<-data %>% group_by(`Marital status`,Violence) %>% summarise(Effectifs=n())
ggplot( a , aes(x=Violence,y=Effectifs,fill=`Marital status`) ) + geom_bar(stat='identity') +geom_text(aes(label=Effectifs),position = position_stack(vjust = 0.5))
```
parmis les 261femmes n'ayant pas été victimes de violences,217 etaient marié.Cet situation est presque la meme du coté des femmes ayant été mariée ou sur 86 ,83 etait maries
```{r}
a<-data %>% group_by(`Marital status`,Violence) %>% summarise(Effectifs=n())
ggplot( a , aes(x=Violence,y=Effectifs,fill=`Marital status`) ) + geom_bar(stat='identity') +geom_text(aes(label=Effectifs),position = position_stack(vjust = 0.5))
```