Skip to content

Commit 6fdf032

Browse files
committed
added práctica 8
1 parent 197c34e commit 6fdf032

File tree

1 file changed

+186
-0
lines changed

1 file changed

+186
-0
lines changed

notebooks/Practica 8.ipynb

+186
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,186 @@
1+
{
2+
"cells": [
3+
{
4+
"cell_type": "markdown",
5+
"metadata": {},
6+
"source": [
7+
"# Práctica 8: corpora and collocations"
8+
]
9+
},
10+
{
11+
"cell_type": "markdown",
12+
"metadata": {},
13+
"source": [
14+
"Ejercicio: completar el siguiente Notebook. Añadir celdas adicionales para pasos intermedios y **mostrar los resultados intermedios**. Podéis añadir celdas de tipo \"Markdown\" para dejar comentarios."
15+
]
16+
},
17+
{
18+
"cell_type": "code",
19+
"execution_count": 2,
20+
"metadata": {
21+
"collapsed": true
22+
},
23+
"outputs": [],
24+
"source": [
25+
"import nltk\n",
26+
"#nltk.download('book')"
27+
]
28+
},
29+
{
30+
"cell_type": "markdown",
31+
"metadata": {
32+
"collapsed": true
33+
},
34+
"source": [
35+
"## Distribución de part-of-speech "
36+
]
37+
},
38+
{
39+
"cell_type": "markdown",
40+
"metadata": {},
41+
"source": [
42+
"Cuando trabajamos con el corpus `Brown` podemos usar `brown.tagged_words()` para obtener el texto anotado con etiquetas morfosintácticas."
43+
]
44+
},
45+
{
46+
"cell_type": "markdown",
47+
"metadata": {},
48+
"source": [
49+
"### 1. ¿Cuáles son las 30 etiquetas más frecuentes en el corpus?"
50+
]
51+
},
52+
{
53+
"cell_type": "code",
54+
"execution_count": null,
55+
"metadata": {
56+
"collapsed": true
57+
},
58+
"outputs": [],
59+
"source": []
60+
},
61+
{
62+
"cell_type": "markdown",
63+
"metadata": {},
64+
"source": [
65+
"### 2. Haz un gráfico con las frecuencias de las 20 etiquetas más frecuentes"
66+
]
67+
},
68+
{
69+
"cell_type": "code",
70+
"execution_count": null,
71+
"metadata": {
72+
"collapsed": true
73+
},
74+
"outputs": [],
75+
"source": []
76+
},
77+
{
78+
"cell_type": "markdown",
79+
"metadata": {},
80+
"source": [
81+
"### 3. Crea la lista de bigramas de etiquetas del corpus Brown"
82+
]
83+
},
84+
{
85+
"cell_type": "code",
86+
"execution_count": null,
87+
"metadata": {
88+
"collapsed": true
89+
},
90+
"outputs": [],
91+
"source": []
92+
},
93+
{
94+
"cell_type": "markdown",
95+
"metadata": {},
96+
"source": [
97+
"### 4. ¿Cuáles son las secuencias de etiquetas más frecuentes (lista y gráfico)?"
98+
]
99+
},
100+
{
101+
"cell_type": "code",
102+
"execution_count": null,
103+
"metadata": {
104+
"collapsed": true
105+
},
106+
"outputs": [],
107+
"source": []
108+
},
109+
{
110+
"cell_type": "markdown",
111+
"metadata": {},
112+
"source": [
113+
"## Ranking y métricas"
114+
]
115+
},
116+
{
117+
"cell_type": "markdown",
118+
"metadata": {},
119+
"source": [
120+
"### 5. ¿Cuáles son las palabras que más frecuentemente preceden la palabra \"water\"?"
121+
]
122+
},
123+
{
124+
"cell_type": "code",
125+
"execution_count": null,
126+
"metadata": {
127+
"collapsed": true
128+
},
129+
"outputs": [],
130+
"source": []
131+
},
132+
{
133+
"cell_type": "markdown",
134+
"metadata": {},
135+
"source": [
136+
"### 6. ¿Y cuáles tienen la asociación más fuerte según la métrica `likelihood_ratio` (y aparecen un mínimo de 5 veces delante de \"water\")?"
137+
]
138+
},
139+
{
140+
"cell_type": "code",
141+
"execution_count": null,
142+
"metadata": {
143+
"collapsed": true
144+
},
145+
"outputs": [],
146+
"source": []
147+
},
148+
{
149+
"cell_type": "markdown",
150+
"metadata": {},
151+
"source": [
152+
"### 7. ¿Y qué adjetivos tienen la asociación más fuerte?"
153+
]
154+
},
155+
{
156+
"cell_type": "code",
157+
"execution_count": null,
158+
"metadata": {
159+
"collapsed": true
160+
},
161+
"outputs": [],
162+
"source": []
163+
}
164+
],
165+
"metadata": {
166+
"kernelspec": {
167+
"display_name": "Python 3",
168+
"language": "python",
169+
"name": "python3"
170+
},
171+
"language_info": {
172+
"codemirror_mode": {
173+
"name": "ipython",
174+
"version": 3
175+
},
176+
"file_extension": ".py",
177+
"mimetype": "text/x-python",
178+
"name": "python",
179+
"nbconvert_exporter": "python",
180+
"pygments_lexer": "ipython3",
181+
"version": "3.4.3"
182+
}
183+
},
184+
"nbformat": 4,
185+
"nbformat_minor": 0
186+
}

0 commit comments

Comments
 (0)