diff --git a/en/lessons/downloading-multiple-records-using-query-strings.md b/en/lessons/downloading-multiple-records-using-query-strings.md index 95beb781d..cc2bbe44d 100644 --- a/en/lessons/downloading-multiple-records-using-query-strings.md +++ b/en/lessons/downloading-multiple-records-using-query-strings.md @@ -27,9 +27,9 @@ doi: 10.46430/phen0005 {% include toc.html %} - - - + ## Module Goals diff --git a/en/lessons/from-html-to-list-of-words-1.md b/en/lessons/from-html-to-list-of-words-1.md index 50807a4fa..a9d9ab035 100755 --- a/en/lessons/from-html-to-list-of-words-1.md +++ b/en/lessons/from-html-to-list-of-words-1.md @@ -30,8 +30,9 @@ doi: 10.46430/phen0006 {% include toc.html %} - - + ## Lesson Goals diff --git a/en/lessons/from-html-to-list-of-words-2.md b/en/lessons/from-html-to-list-of-words-2.md index 7a8c064a8..3485dcb6b 100755 --- a/en/lessons/from-html-to-list-of-words-2.md +++ b/en/lessons/from-html-to-list-of-words-2.md @@ -28,9 +28,9 @@ doi: 10.46430/phen0007 {% include toc.html %} - - - + ## Lesson Goals diff --git a/en/lessons/naive-bayesian.md b/en/lessons/naive-bayesian.md index 686017dd2..c484070e5 100755 --- a/en/lessons/naive-bayesian.md +++ b/en/lessons/naive-bayesian.md @@ -21,6 +21,9 @@ doi: 10.46430/phen0038 {% include toc.html %} + ## Introduction diff --git a/en/lessons/normalizing-data.md b/en/lessons/normalizing-data.md index 3338d642e..70ff98079 100755 --- a/en/lessons/normalizing-data.md +++ b/en/lessons/normalizing-data.md @@ -29,9 +29,9 @@ doi: 10.46430/phen0014 {% include toc.html %} - - - + ## Lesson Goals diff --git a/en/lessons/preserving-your-research-data.md b/en/lessons/preserving-your-research-data.md index 0cd1054c2..a5eddb563 100755 --- a/en/lessons/preserving-your-research-data.md +++ b/en/lessons/preserving-your-research-data.md @@ -23,9 +23,9 @@ doi: 10.46430/phen0039 {% include toc.html %} - - - + #### Background diff --git a/en/lessons/working-with-web-pages.md b/en/lessons/working-with-web-pages.md index bc1fd4639..2419ff324 100755 --- a/en/lessons/working-with-web-pages.md +++ b/en/lessons/working-with-web-pages.md @@ -29,9 +29,9 @@ doi: 10.46430/phen0021 {% include toc.html %} - - - + Lesson Goals ------------ diff --git a/es/lecciones/de-html-a-lista-de-palabras-1.md b/es/lecciones/de-html-a-lista-de-palabras-1.md index b6cacdc8f..576d79fee 100644 --- a/es/lecciones/de-html-a-lista-de-palabras-1.md +++ b/es/lecciones/de-html-a-lista-de-palabras-1.md @@ -36,9 +36,9 @@ series_total: 15 {% include toc.html %} - - - +
+El sitio web de Old Bailey Online fue actualizado recientemente. Desafortunadamente, debido a diversos cambios, muchos (si no todos) de los elementos del ejemplo utilizado en esta lección no funcionarán como se describe. Sin embargo, las metodologías que se enseñan en la lección siguen siendo relevantes y los lectores pueden adaptarlas para otros sitios web. Aunque estamos trabajando en adaptar la lección para la nueva Old Bailey Online, no tenemos un cronograma claro sobre cuándo actualizaremos la lección. [abril de 2024] +
## Objetivos de la lección diff --git a/es/lecciones/de-html-a-lista-de-palabras-2.md b/es/lecciones/de-html-a-lista-de-palabras-2.md index cca026c09..abbcbbf76 100644 --- a/es/lecciones/de-html-a-lista-de-palabras-2.md +++ b/es/lecciones/de-html-a-lista-de-palabras-2.md @@ -36,9 +36,9 @@ series_total: 15 {% include toc.html %} - - - +
+El sitio web de Old Bailey Online fue actualizado recientemente. Desafortunadamente, debido a diversos cambios, muchos (si no todos) de los elementos del ejemplo utilizado en esta lección no funcionarán como se describe. Sin embargo, las metodologías que se enseñan en la lección siguen siendo relevantes y los lectores pueden adaptarlas para otros sitios web. Aunque estamos trabajando en adaptar la lección para la nueva Old Bailey Online, no tenemos un cronograma claro sobre cuándo actualizaremos la lección. [abril de 2024] +
## Objetivos de la lección diff --git a/es/lecciones/descarga-multiples-registros-usando-cadenas-de-consulta.md b/es/lecciones/descarga-multiples-registros-usando-cadenas-de-consulta.md index c1c3268ae..eb389130a 100644 --- a/es/lecciones/descarga-multiples-registros-usando-cadenas-de-consulta.md +++ b/es/lecciones/descarga-multiples-registros-usando-cadenas-de-consulta.md @@ -34,8 +34,9 @@ series_total: 15 {% include toc.html %} - - +
+El sitio web de Old Bailey Online fue actualizado recientemente. Desafortunadamente, debido a diversos cambios, muchos (si no todos) de los elementos del ejemplo utilizado en esta lección no funcionarán como se describe. Sin embargo, las metodologías que se enseñan en la lección siguen siendo relevantes y los lectores pueden adaptarlas para otros sitios web. Aunque estamos trabajando en adaptar la lección para la nueva Old Bailey Online, no tenemos un cronograma claro sobre cuándo actualizaremos la lección. [abril de 2024] +
## Objetivos del módulo diff --git a/es/lecciones/normalizar-datos.md b/es/lecciones/normalizar-datos.md index 0c34c7c19..2590d798b 100644 --- a/es/lecciones/normalizar-datos.md +++ b/es/lecciones/normalizar-datos.md @@ -37,9 +37,9 @@ series_total: 15 {% include toc.html %} - - - +
+El sitio web de Old Bailey Online fue actualizado recientemente. Desafortunadamente, debido a diversos cambios, muchos (si no todos) de los elementos del ejemplo utilizado en esta lección no funcionarán como se describe. Sin embargo, las metodologías que se enseñan en la lección siguen siendo relevantes y los lectores pueden adaptarlas para otros sitios web. Aunque estamos trabajando en adaptar la lección para la nueva Old Bailey Online, no tenemos un cronograma claro sobre cuándo actualizaremos la lección. [abril de 2024] +
## Objetivos de la lección diff --git a/es/lecciones/preservar-datos-de-investigacion.md b/es/lecciones/preservar-datos-de-investigacion.md index a0becd79b..003776bb6 100644 --- a/es/lecciones/preservar-datos-de-investigacion.md +++ b/es/lecciones/preservar-datos-de-investigacion.md @@ -30,8 +30,9 @@ doi: 10.46430/phes0023 {% include toc.html %} - - +
+El sitio web de Old Bailey Online fue actualizado recientemente. Desafortunadamente, debido a diversos cambios, muchos (si no todos) de los elementos del ejemplo utilizado en esta lección no funcionarán como se describe. Sin embargo, las metodologías que se enseñan en la lección siguen siendo relevantes y los lectores pueden adaptarlas para otros sitios web. Aunque estamos trabajando en adaptar la lección para la nueva Old Bailey Online, no tenemos un cronograma claro sobre cuándo actualizaremos la lección. [abril de 2024] +
#### La cuestión de fondo diff --git a/es/lecciones/trabajar-con-paginas-web.md b/es/lecciones/trabajar-con-paginas-web.md index 58c0dd34f..558e81c01 100644 --- a/es/lecciones/trabajar-con-paginas-web.md +++ b/es/lecciones/trabajar-con-paginas-web.md @@ -38,9 +38,9 @@ series_total: 15 {% include toc.html %} - - - +
+El sitio web de Old Bailey Online fue actualizado recientemente. Desafortunadamente, debido a diversos cambios, muchos (si no todos) de los elementos del ejemplo utilizado en esta lección no funcionarán como se describe. Sin embargo, las metodologías que se enseñan en la lección siguen siendo relevantes y los lectores pueden adaptarlas para otros sitios web. Aunque estamos trabajando en adaptar la lección para la nueva Old Bailey Online, no tenemos un cronograma claro sobre cuándo actualizaremos la lección. [abril de 2024] +
Objetivos de la lección ----------------------- diff --git a/fr/lecons/du-html-a-une-liste-de-mots-1.md b/fr/lecons/du-html-a-une-liste-de-mots-1.md index d745e37b7..5e585632e 100644 --- a/fr/lecons/du-html-a-une-liste-de-mots-1.md +++ b/fr/lecons/du-html-a-une-liste-de-mots-1.md @@ -32,6 +32,10 @@ doi: 10.46430/phfr0026 {% include toc.html %} + + ## Objectifs de la leçon Dans cette leçon en deux parties, nous allons utiliser les compétences acquises dans la leçon [Télécharger des pages web avec Python](/fr/lecons/telecharger-des-pages-web-avec-python), et voir comment supprimer les *balises HTML* de la page de la [transcription du procès-verbal de Benjamin Bowsey en 1780](https://www.oldbaileyonline.org/browse.jsp?id=t17800628-33&div=t17800628-33) dans le but de créer un texte propre et réutilisable. Nous réaliserons cette tâche en utilisant les *opérateurs et méthodes de chaines de caractères* propres à Python, ainsi que nos compétences relatives à la [*lecture attentive*](https://perma.cc/V4GX-9N5R). Nous introduirons ensuite les concepts de *boucles* et *d’instructions conditionnelles* afin de répéter notre processus de traitement et de tester certaines conditions nous permettant de séparer le contenu des balises HTML. Pour finir, nous convertirons les données obtenues et enregistrées sous la forme d’un texte sans balises HTML en une *liste de mots* qui pourra par la suite être triée, indexée et investie lors d’analyses statistiques. diff --git a/fr/lecons/du-html-a-une-liste-de-mots-2.md b/fr/lecons/du-html-a-une-liste-de-mots-2.md index 2505da901..48a00743f 100644 --- a/fr/lecons/du-html-a-une-liste-de-mots-2.md +++ b/fr/lecons/du-html-a-une-liste-de-mots-2.md @@ -31,6 +31,11 @@ doi: 10.46430/phfr0028 --- {% include toc.html %} + + + ## Objectifs de la leçon Dans cette leçon, nous allons implémenter l’algorithme dont nous avons parlé dans [la première partie](/fr/lecons/du-html-a-une-liste-de-mots-1) de cette leçon. Nous avons jusque-là pu écrire une procédure chargeant le contenu d’une page HTML et retournant le contenu présent entre la première balise `

` et la dernière balise `
`. diff --git a/fr/lecons/preserver-ses-donnees-de-recherche.md b/fr/lecons/preserver-ses-donnees-de-recherche.md index f57d8b4ad..7a079b3ba 100644 --- a/fr/lecons/preserver-ses-donnees-de-recherche.md +++ b/fr/lecons/preserver-ses-donnees-de-recherche.md @@ -32,9 +32,9 @@ doi: 10.46430/phfr0009 {% include toc.html %} - - - +

#### Contexte diff --git a/fr/lecons/telecharger-des-pages-web-avec-python.md b/fr/lecons/telecharger-des-pages-web-avec-python.md index bd861753a..c7c2e9bee 100644 --- a/fr/lecons/telecharger-des-pages-web-avec-python.md +++ b/fr/lecons/telecharger-des-pages-web-avec-python.md @@ -33,9 +33,9 @@ doi: 10.46430/phfr0017 {% include toc.html %} - - - + ## Objectifs de la leçon diff --git a/pt/licoes/HTML-lista-palavras-1.md b/pt/licoes/HTML-lista-palavras-1.md index 8ba40f236..b6da4f60c 100644 --- a/pt/licoes/HTML-lista-palavras-1.md +++ b/pt/licoes/HTML-lista-palavras-1.md @@ -32,6 +32,10 @@ doi: 10.46430/phpt0027 {% include toc.html %} +
+O site do Old Bailey Online foi recentemente atualizado. Infelizmente, devido às diversas mudanças, muitos (se não todos) os elementos do site de exemplo usado nesta lição não funcionarão conforme descrito. No entanto, as metodologias ensinadas por esta lição permanecem relevantes e podem ser adaptadas pelos leitores para um site de exemplo diferente. Estamos trabalhando na adaptação da lição para o novo site do Old Bailey Online, mas ainda não temos cronograma preciso de quando a lição será atualizada. [Abril de 2024] +
+ ## Objetivos da lição Nesta lição de duas partes, aprofundaremos o que aprendeu sobre o [Download de Páginas Web com Python](/pt/licoes/download-paginas-web-python), aprendendo como remover a *marcação HTML* de uma página web da [transcrição do julgamento criminal de Benjamin Bowsey em 1780](https://perma.cc/8LM6-W39K). Faremos isso usando uma variedade de *operadores de string*, *métodos de string* e habilidades de leitura atenta. Introduziremos *looping* e *branching* de modo que os programas possam repetir tarefas e testar certas condições, tornando possível a separação do conteúdo das tags HTML. Finalmente, faremos a conversão do conteúdo de uma string longa para uma *lista de palavras*, que podem ser ordenadas, indexadas e contabilizadas posteriormente. diff --git a/pt/licoes/HTML-lista-palavras-2.md b/pt/licoes/HTML-lista-palavras-2.md index b4209cfbe..0cff91bc0 100644 --- a/pt/licoes/HTML-lista-palavras-2.md +++ b/pt/licoes/HTML-lista-palavras-2.md @@ -32,6 +32,10 @@ doi: 10.46430/phpt0028 {% include toc.html %} +
+O site do Old Bailey Online foi recentemente atualizado. Infelizmente, devido às diversas mudanças, muitos (se não todos) os elementos do site de exemplo usado nesta lição não funcionarão conforme descrito. No entanto, as metodologias ensinadas por esta lição permanecem relevantes e podem ser adaptadas pelos leitores para um site de exemplo diferente. Estamos trabalhando na adaptação da lição para o novo site do Old Bailey Online, mas ainda não temos cronograma preciso de quando a lição será atualizada. [Abril de 2024] +
+ ## Objetivos da Lição Nesta lição aprenderá os comandos de Python necessários para implementar a segunda parte do algoritmo iniciado na lição [De HTML para Lista de Palavras (parte 1)](/pt/licoes/HTML-lista-palavras-1). A primeira metade do algoritmo obtém o conteúdo de uma página HTML e salva apenas o conteúdo entre a primeira tag `

` e a última tag `
`. A segunda metade do algoritmo faz o seguinte: diff --git a/pt/licoes/download-multiplos-registros-query-strings.md b/pt/licoes/download-multiplos-registros-query-strings.md index f2e6368cf..dd4d26e20 100644 --- a/pt/licoes/download-multiplos-registros-query-strings.md +++ b/pt/licoes/download-multiplos-registros-query-strings.md @@ -33,6 +33,10 @@ doi: 10.46430/phpt0034 {% include toc.html %} +

+O site do Old Bailey Online foi recentemente atualizado. Infelizmente, devido às diversas mudanças, muitos (se não todos) os elementos do site de exemplo usado nesta lição não funcionarão conforme descrito. No entanto, as metodologias ensinadas por esta lição permanecem relevantes e podem ser adaptadas pelos leitores para um site de exemplo diferente. Estamos trabalhando na adaptação da lição para o novo site do Old Bailey Online, mas ainda não temos cronograma preciso de quando a lição será atualizada. [Abril de 2024] +
+ ## Objetivos do Módulo Fazer o *download* de um único registro de um website é fácil, mas fazer o *download* de vários registros de uma vez - uma necessidade cada vez mais frequente para um historiador - é muito mais eficiente usando uma linguagem de programação como o Python. Nesta lição, escreveremos um programa que fará o *download* de uma série de registros do *[Old Bailey Online](http://www.oldbaileyonline.org/)* usando critérios de investigação personalizados e irá armazená-los num diretório no nosso computador. Esse processo envolve interpretar e manipular *Query Strings* de URL. Nesse caso, o tutorial buscará fazer o *download* de fontes que contenham referências a afrodescendentes que foram publicadas no *Old Bailey Proceedings* entre 1700 e 1750. diff --git a/pt/licoes/download-paginas-web-python.md b/pt/licoes/download-paginas-web-python.md index ba0aa076f..14405f5a5 100644 --- a/pt/licoes/download-paginas-web-python.md +++ b/pt/licoes/download-paginas-web-python.md @@ -32,7 +32,9 @@ doi: 10.46430/phpt0010 {% include toc.html %} - +
+O site do Old Bailey Online foi recentemente atualizado. Infelizmente, devido às diversas mudanças, muitos (se não todos) os elementos do site de exemplo usado nesta lição não funcionarão conforme descrito. No entanto, as metodologias ensinadas por esta lição permanecem relevantes e podem ser adaptadas pelos leitores para um site de exemplo diferente. Estamos trabalhando na adaptação da lição para o novo site do Old Bailey Online, mas ainda não temos cronograma preciso de quando a lição será atualizada. [Abril de 2024] +
### Objetivos da Lição diff --git a/pt/licoes/normalizacao-dados-textuais-python.md b/pt/licoes/normalizacao-dados-textuais-python.md index ee077748d..b83e651b2 100644 --- a/pt/licoes/normalizacao-dados-textuais-python.md +++ b/pt/licoes/normalizacao-dados-textuais-python.md @@ -33,6 +33,10 @@ doi: 10.46430/phpt0029 {% include toc.html %} +
+O site do Old Bailey Online foi recentemente atualizado. Infelizmente, devido às diversas mudanças, muitos (se não todos) os elementos do site de exemplo usado nesta lição não funcionarão conforme descrito. No entanto, as metodologias ensinadas por esta lição permanecem relevantes e podem ser adaptadas pelos leitores para um site de exemplo diferente. Estamos trabalhando na adaptação da lição para o novo site do Old Bailey Online, mas ainda não temos cronograma preciso de quando a lição será atualizada. [Abril de 2024] +
+ ## Objetivos da Lição A lista que criámos na lição [De HTML para Lista de Palavras (parte 2)](/pt/licoes/HTML-lista-palavras-2) precisa ser normalizada antes de poder ser utilizada. Faremos isso através da aplicação de alguns métodos de string adicionais, bem como utilizando expressões regulares. Uma vez normalizados, estaremos aptos a analisar os nossos dados mais facilmente. diff --git a/pt/licoes/preservar-os-seus-dados-de-investigacao.md b/pt/licoes/preservar-os-seus-dados-de-investigacao.md index bed50809c..85d958a29 100644 --- a/pt/licoes/preservar-os-seus-dados-de-investigacao.md +++ b/pt/licoes/preservar-os-seus-dados-de-investigacao.md @@ -31,9 +31,9 @@ doi: 10.46430/phpt0001 {% include toc.html %} - - - +
+O site do Old Bailey Online foi recentemente atualizado. Infelizmente, devido às diversas mudanças, muitos (se não todos) os elementos do site de exemplo usado nesta lição não funcionarão conforme descrito. No entanto, as metodologias ensinadas por esta lição permanecem relevantes e podem ser adaptadas pelos leitores para um site de exemplo diferente. Estamos trabalhando na adaptação da lição para o novo site do Old Bailey Online, mas ainda não temos cronograma preciso de quando a lição será atualizada. [Abril de 2024] +
#### Histórico