Skip to content

Commit

Permalink
Merge pull request #3255 from programminghistorian/Issue-3254
Browse files Browse the repository at this point in the history
Issue 3254
  • Loading branch information
charlottejmc authored May 10, 2024
2 parents e358599 + 7d57abd commit e7550d9
Show file tree
Hide file tree
Showing 23 changed files with 76 additions and 43 deletions.
Original file line number Diff line number Diff line change
Expand Up @@ -27,9 +27,9 @@ doi: 10.46430/phen0005

{% include toc.html %}




<div class="alert alert-warning" role="alert">
The Old Bailey Online’s website has recently been updated. Unfortunately, due to the various <a href="https://www.oldbaileyonline.org/about/whats-new">changes</a>, many (if not all) elements of the example website used in this lesson will not work as described. The methodologies taught by this lesson remain relevant, however, and may be adapted by readers to a different example site. We are working on adapting the lesson to the new Old Bailey Online website, but we have no clear timeline on when the lesson will be updated. [April 2024]
</div>

## Module Goals

Expand Down
5 changes: 3 additions & 2 deletions en/lessons/from-html-to-list-of-words-1.md
Original file line number Diff line number Diff line change
Expand Up @@ -30,8 +30,9 @@ doi: 10.46430/phen0006
{% include toc.html %}




<div class="alert alert-warning" role="alert">
The Old Bailey Online’s website has recently been updated. Unfortunately, due to the various <a href="https://www.oldbaileyonline.org/about/whats-new">changes</a>, many (if not all) elements of the example website used in this lesson will not work as described. The methodologies taught by this lesson remain relevant, however, and may be adapted by readers to a different example site. We are working on adapting the lesson to the new Old Bailey Online website, but we have no clear timeline on when the lesson will be updated. [April 2024]
</div>

## Lesson Goals

Expand Down
6 changes: 3 additions & 3 deletions en/lessons/from-html-to-list-of-words-2.md
Original file line number Diff line number Diff line change
Expand Up @@ -28,9 +28,9 @@ doi: 10.46430/phen0007

{% include toc.html %}




<div class="alert alert-warning" role="alert">
The Old Bailey Online’s website has recently been updated. Unfortunately, due to the various <a href="https://www.oldbaileyonline.org/about/whats-new">changes</a>, many (if not all) elements of the example website used in this lesson will not work as described. The methodologies taught by this lesson remain relevant, however, and may be adapted by readers to a different example site. We are working on adapting the lesson to the new Old Bailey Online website, but we have no clear timeline on when the lesson will be updated. [April 2024]
</div>

## Lesson Goals

Expand Down
3 changes: 3 additions & 0 deletions en/lessons/naive-bayesian.md
Original file line number Diff line number Diff line change
Expand Up @@ -21,6 +21,9 @@ doi: 10.46430/phen0038

{% include toc.html %}

<div class="alert alert-warning" role="alert">
The Old Bailey Online’s website has recently been updated. Unfortunately, due to the various <a href="https://www.oldbaileyonline.org/about/whats-new">changes</a>, many (if not all) elements of the example website used in this lesson will not work as described. The methodologies taught by this lesson remain relevant, however, and may be adapted by readers to a different example site. We are working on adapting the lesson to the new Old Bailey Online website, but we have no clear timeline on when the lesson will be updated. [April 2024]
</div>

## Introduction

Expand Down
6 changes: 3 additions & 3 deletions en/lessons/normalizing-data.md
Original file line number Diff line number Diff line change
Expand Up @@ -29,9 +29,9 @@ doi: 10.46430/phen0014

{% include toc.html %}




<div class="alert alert-warning" role="alert">
The Old Bailey Online’s website has recently been updated. Unfortunately, due to the various <a href="https://www.oldbaileyonline.org/about/whats-new">changes</a>, many (if not all) elements of the example website used in this lesson will not work as described. The methodologies taught by this lesson remain relevant, however, and may be adapted by readers to a different example site. We are working on adapting the lesson to the new Old Bailey Online website, but we have no clear timeline on when the lesson will be updated. [April 2024]
</div>

## Lesson Goals

Expand Down
6 changes: 3 additions & 3 deletions en/lessons/preserving-your-research-data.md
Original file line number Diff line number Diff line change
Expand Up @@ -23,9 +23,9 @@ doi: 10.46430/phen0039

{% include toc.html %}




<div class="alert alert-warning" role="alert">
The Old Bailey Online’s website has recently been updated. Unfortunately, due to the various <a href="https://www.oldbaileyonline.org/about/whats-new">changes</a>, many (if not all) elements of the example website used in this lesson will not work as described. The methodologies taught by this lesson remain relevant, however, and may be adapted by readers to a different example site. We are working on adapting the lesson to the new Old Bailey Online website, but we have no clear timeline on when the lesson will be updated. [April 2024]
</div>

#### Background

Expand Down
6 changes: 3 additions & 3 deletions en/lessons/working-with-web-pages.md
Original file line number Diff line number Diff line change
Expand Up @@ -29,9 +29,9 @@ doi: 10.46430/phen0021

{% include toc.html %}




<div class="alert alert-warning" role="alert">
The Old Bailey Online’s website has recently been updated. Unfortunately, due to the various <a href="https://www.oldbaileyonline.org/about/whats-new">changes</a>, many (if not all) elements of the example website used in this lesson will not work as described. The methodologies taught by this lesson remain relevant, however, and may be adapted by readers to a different example site. We are working on adapting the lesson to the new Old Bailey Online website, but we have no clear timeline on when the lesson will be updated. [April 2024]
</div>

Lesson Goals
------------
Expand Down
6 changes: 3 additions & 3 deletions es/lecciones/de-html-a-lista-de-palabras-1.md
Original file line number Diff line number Diff line change
Expand Up @@ -36,9 +36,9 @@ series_total: 15

{% include toc.html %}




<div class="alert alert-warning">
El sitio web de Old Bailey Online fue actualizado recientemente. Desafortunadamente, debido a diversos <a href="https://www.oldbaileyonline.org/about/whats-new">cambios</a>, muchos (si no todos) de los elementos del ejemplo utilizado en esta lección no funcionarán como se describe. Sin embargo, las metodologías que se enseñan en la lección siguen siendo relevantes y los lectores pueden adaptarlas para otros sitios web. Aunque estamos trabajando en adaptar la lección para la nueva Old Bailey Online, no tenemos un cronograma claro sobre cuándo actualizaremos la lección. [abril de 2024]
</div>

## Objetivos de la lección

Expand Down
6 changes: 3 additions & 3 deletions es/lecciones/de-html-a-lista-de-palabras-2.md
Original file line number Diff line number Diff line change
Expand Up @@ -36,9 +36,9 @@ series_total: 15

{% include toc.html %}




<div class="alert alert-warning">
El sitio web de Old Bailey Online fue actualizado recientemente. Desafortunadamente, debido a diversos <a href="https://www.oldbaileyonline.org/about/whats-new">cambios</a>, muchos (si no todos) de los elementos del ejemplo utilizado en esta lección no funcionarán como se describe. Sin embargo, las metodologías que se enseñan en la lección siguen siendo relevantes y los lectores pueden adaptarlas para otros sitios web. Aunque estamos trabajando en adaptar la lección para la nueva Old Bailey Online, no tenemos un cronograma claro sobre cuándo actualizaremos la lección. [abril de 2024]
</div>

## Objetivos de la lección

Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -34,8 +34,9 @@ series_total: 15

{% include toc.html %}



<div class="alert alert-warning">
El sitio web de Old Bailey Online fue actualizado recientemente. Desafortunadamente, debido a diversos <a href="https://www.oldbaileyonline.org/about/whats-new">cambios</a>, muchos (si no todos) de los elementos del ejemplo utilizado en esta lección no funcionarán como se describe. Sin embargo, las metodologías que se enseñan en la lección siguen siendo relevantes y los lectores pueden adaptarlas para otros sitios web. Aunque estamos trabajando en adaptar la lección para la nueva Old Bailey Online, no tenemos un cronograma claro sobre cuándo actualizaremos la lección. [abril de 2024]
</div>

## Objetivos del módulo

Expand Down
6 changes: 3 additions & 3 deletions es/lecciones/normalizar-datos.md
Original file line number Diff line number Diff line change
Expand Up @@ -37,9 +37,9 @@ series_total: 15

{% include toc.html %}




<div class="alert alert-warning">
El sitio web de Old Bailey Online fue actualizado recientemente. Desafortunadamente, debido a diversos <a href="https://www.oldbaileyonline.org/about/whats-new">cambios</a>, muchos (si no todos) de los elementos del ejemplo utilizado en esta lección no funcionarán como se describe. Sin embargo, las metodologías que se enseñan en la lección siguen siendo relevantes y los lectores pueden adaptarlas para otros sitios web. Aunque estamos trabajando en adaptar la lección para la nueva Old Bailey Online, no tenemos un cronograma claro sobre cuándo actualizaremos la lección. [abril de 2024]
</div>

## Objetivos de la lección

Expand Down
5 changes: 3 additions & 2 deletions es/lecciones/preservar-datos-de-investigacion.md
Original file line number Diff line number Diff line change
Expand Up @@ -30,8 +30,9 @@ doi: 10.46430/phes0023

{% include toc.html %}



<div class="alert alert-warning">
El sitio web de Old Bailey Online fue actualizado recientemente. Desafortunadamente, debido a diversos <a href="https://www.oldbaileyonline.org/about/whats-new">cambios</a>, muchos (si no todos) de los elementos del ejemplo utilizado en esta lección no funcionarán como se describe. Sin embargo, las metodologías que se enseñan en la lección siguen siendo relevantes y los lectores pueden adaptarlas para otros sitios web. Aunque estamos trabajando en adaptar la lección para la nueva Old Bailey Online, no tenemos un cronograma claro sobre cuándo actualizaremos la lección. [abril de 2024]
</div>


#### La cuestión de fondo
Expand Down
6 changes: 3 additions & 3 deletions es/lecciones/trabajar-con-paginas-web.md
Original file line number Diff line number Diff line change
Expand Up @@ -38,9 +38,9 @@ series_total: 15

{% include toc.html %}




<div class="alert alert-warning">
El sitio web de Old Bailey Online fue actualizado recientemente. Desafortunadamente, debido a diversos <a href="https://www.oldbaileyonline.org/about/whats-new">cambios</a>, muchos (si no todos) de los elementos del ejemplo utilizado en esta lección no funcionarán como se describe. Sin embargo, las metodologías que se enseñan en la lección siguen siendo relevantes y los lectores pueden adaptarlas para otros sitios web. Aunque estamos trabajando en adaptar la lección para la nueva Old Bailey Online, no tenemos un cronograma claro sobre cuándo actualizaremos la lección. [abril de 2024]
</div>

Objetivos de la lección
-----------------------
Expand Down
4 changes: 4 additions & 0 deletions fr/lecons/du-html-a-une-liste-de-mots-1.md
Original file line number Diff line number Diff line change
Expand Up @@ -32,6 +32,10 @@ doi: 10.46430/phfr0026

{% include toc.html %}

<div class="alert alert-warning" role="alert">
Le site web du Old Bailey Online a récemment été mis à jour. Malheureusement, à cause de ces <a href="https://www.oldbaileyonline.org/about/whats-new">changements</a>, certains éléments utilisés dans cette leçon (voire tous) ne fonctionneront plus comme ils sont décrits. Les méthodologies enseignées dans cette leçon restent tout de même pertinentes, et peuvent être adaptées à un autre site. Nous essayons actuellement d'adapter la leçon au nouveau site du Old Bailey Online, mais nous ne pouvons pas encore déterminer quand la leçon sera prête. [Avril 2024]
</div>

## Objectifs de la leçon

Dans cette leçon en deux parties, nous allons utiliser les compétences acquises dans la leçon [Télécharger des pages web avec Python](/fr/lecons/telecharger-des-pages-web-avec-python), et voir comment supprimer les *balises HTML* de la page de la [transcription du procès-verbal de Benjamin Bowsey en 1780](https://www.oldbaileyonline.org/browse.jsp?id=t17800628-33&div=t17800628-33) dans le but de créer un texte propre et réutilisable. Nous réaliserons cette tâche en utilisant les *opérateurs et méthodes de chaines de caractères* propres à Python, ainsi que nos compétences relatives à la [*lecture attentive*](https://perma.cc/V4GX-9N5R). Nous introduirons ensuite les concepts de *boucles* et *d’instructions conditionnelles* afin de répéter notre processus de traitement et de tester certaines conditions nous permettant de séparer le contenu des balises HTML. Pour finir, nous convertirons les données obtenues et enregistrées sous la forme d’un texte sans balises HTML en une *liste de mots* qui pourra par la suite être triée, indexée et investie lors d’analyses statistiques.
Expand Down
5 changes: 5 additions & 0 deletions fr/lecons/du-html-a-une-liste-de-mots-2.md
Original file line number Diff line number Diff line change
Expand Up @@ -31,6 +31,11 @@ doi: 10.46430/phfr0028
---

{% include toc.html %}

<div class="alert alert-warning" role="alert">
Le site web du Old Bailey Online a récemment été mis à jour. Malheureusement, à cause de ces <a href="https://www.oldbaileyonline.org/about/whats-new">changements</a>, certains éléments utilisés dans cette leçon (voire tous) ne fonctionneront plus comme ils sont décrits. Les méthodologies enseignées dans cette leçon restent tout de même pertinentes, et peuvent être adaptées à un autre site. Nous essayons actuellement d'adapter la leçon au nouveau site du Old Bailey Online, mais nous ne pouvons pas encore déterminer quand la leçon sera prête. [Avril 2024]
</div>

## Objectifs de la leçon

Dans cette leçon, nous allons implémenter l’algorithme dont nous avons parlé dans [la première partie](/fr/lecons/du-html-a-une-liste-de-mots-1) de cette leçon. Nous avons jusque-là pu écrire une procédure chargeant le contenu d’une page HTML et retournant le contenu présent entre la première balise `<p>` et la dernière balise `<br/>`.
Expand Down
6 changes: 3 additions & 3 deletions fr/lecons/preserver-ses-donnees-de-recherche.md
Original file line number Diff line number Diff line change
Expand Up @@ -32,9 +32,9 @@ doi: 10.46430/phfr0009

{% include toc.html %}




<div class="alert alert-warning" role="alert">
Le site web du Old Bailey Online a récemment été mis à jour. Malheureusement, à cause de ces <a href="https://www.oldbaileyonline.org/about/whats-new">changements</a>, certains éléments utilisés dans cette leçon (voire tous) ne fonctionneront plus comme ils sont décrits. Les méthodologies enseignées dans cette leçon restent tout de même pertinentes, et peuvent être adaptées à un autre site. Nous essayons actuellement d'adapter la leçon au nouveau site du Old Bailey Online, mais nous ne pouvons pas encore déterminer quand la leçon sera prête. [Avril 2024]
</div>

#### Contexte

Expand Down
6 changes: 3 additions & 3 deletions fr/lecons/telecharger-des-pages-web-avec-python.md
Original file line number Diff line number Diff line change
Expand Up @@ -33,9 +33,9 @@ doi: 10.46430/phfr0017

{% include toc.html %}




<div class="alert alert-warning" role="alert">
Le site web du Old Bailey Online a récemment été mis à jour. Malheureusement, à cause de ces <a href="https://www.oldbaileyonline.org/about/whats-new">changements</a>, certains éléments utilisés dans cette leçon (voire tous) ne fonctionneront plus comme ils sont décrits. Les méthodologies enseignées dans cette leçon restent tout de même pertinentes, et peuvent être adaptées à un autre site. Nous essayons actuellement d'adapter la leçon au nouveau site du Old Bailey Online, mais nous ne pouvons pas encore déterminer quand la leçon sera prête. [Avril 2024]
</div>

## Objectifs de la leçon

Expand Down
4 changes: 4 additions & 0 deletions pt/licoes/HTML-lista-palavras-1.md
Original file line number Diff line number Diff line change
Expand Up @@ -32,6 +32,10 @@ doi: 10.46430/phpt0027

{% include toc.html %}

<div class="alert alert-warning">
O site do Old Bailey Online foi recentemente atualizado. Infelizmente, devido às diversas <a href="https://www.oldbaileyonline.org/about/whats-new">mudanças</a>, muitos (se não todos) os elementos do site de exemplo usado nesta lição não funcionarão conforme descrito. No entanto, as metodologias ensinadas por esta lição permanecem relevantes e podem ser adaptadas pelos leitores para um site de exemplo diferente. Estamos trabalhando na adaptação da lição para o novo site do Old Bailey Online, mas ainda não temos cronograma preciso de quando a lição será atualizada. [Abril de 2024]
</div>

## Objetivos da lição

Nesta lição de duas partes, aprofundaremos o que aprendeu sobre o [Download de Páginas Web com Python](/pt/licoes/download-paginas-web-python), aprendendo como remover a *marcação HTML* de uma página web da [transcrição do julgamento criminal de Benjamin Bowsey em 1780](https://perma.cc/8LM6-W39K). Faremos isso usando uma variedade de *operadores de string*, *métodos de string* e habilidades de leitura atenta. Introduziremos *looping* e *branching* de modo que os programas possam repetir tarefas e testar certas condições, tornando possível a separação do conteúdo das tags HTML. Finalmente, faremos a conversão do conteúdo de uma string longa para uma *lista de palavras*, que podem ser ordenadas, indexadas e contabilizadas posteriormente.
Expand Down
4 changes: 4 additions & 0 deletions pt/licoes/HTML-lista-palavras-2.md
Original file line number Diff line number Diff line change
Expand Up @@ -32,6 +32,10 @@ doi: 10.46430/phpt0028

{% include toc.html %}

<div class="alert alert-warning">
O site do Old Bailey Online foi recentemente atualizado. Infelizmente, devido às diversas <a href="https://www.oldbaileyonline.org/about/whats-new">mudanças</a>, muitos (se não todos) os elementos do site de exemplo usado nesta lição não funcionarão conforme descrito. No entanto, as metodologias ensinadas por esta lição permanecem relevantes e podem ser adaptadas pelos leitores para um site de exemplo diferente. Estamos trabalhando na adaptação da lição para o novo site do Old Bailey Online, mas ainda não temos cronograma preciso de quando a lição será atualizada. [Abril de 2024]
</div>

## Objetivos da Lição

Nesta lição aprenderá os comandos de Python necessários para implementar a segunda parte do algoritmo iniciado na lição [De HTML para Lista de Palavras (parte 1)](/pt/licoes/HTML-lista-palavras-1). A primeira metade do algoritmo obtém o conteúdo de uma página HTML e salva apenas o conteúdo entre a primeira tag `<p>` e a última tag `<br/>`. A segunda metade do algoritmo faz o seguinte:
Expand Down
4 changes: 4 additions & 0 deletions pt/licoes/download-multiplos-registros-query-strings.md
Original file line number Diff line number Diff line change
Expand Up @@ -33,6 +33,10 @@ doi: 10.46430/phpt0034

{% include toc.html %}

<div class="alert alert-warning">
O site do Old Bailey Online foi recentemente atualizado. Infelizmente, devido às diversas <a href="https://www.oldbaileyonline.org/about/whats-new">mudanças</a>, muitos (se não todos) os elementos do site de exemplo usado nesta lição não funcionarão conforme descrito. No entanto, as metodologias ensinadas por esta lição permanecem relevantes e podem ser adaptadas pelos leitores para um site de exemplo diferente. Estamos trabalhando na adaptação da lição para o novo site do Old Bailey Online, mas ainda não temos cronograma preciso de quando a lição será atualizada. [Abril de 2024]
</div>

## Objetivos do Módulo

Fazer o *download* de um único registro de um website é fácil, mas fazer o *download* de vários registros de uma vez - uma necessidade cada vez mais frequente para um historiador - é muito mais eficiente usando uma linguagem de programação como o Python. Nesta lição, escreveremos um programa que fará o *download* de uma série de registros do *[Old Bailey Online](http://www.oldbaileyonline.org/)* usando critérios de investigação personalizados e irá armazená-los num diretório no nosso computador. Esse processo envolve interpretar e manipular *Query Strings* de URL. Nesse caso, o tutorial buscará fazer o *download* de fontes que contenham referências a afrodescendentes que foram publicadas no *Old Bailey Proceedings* entre 1700 e 1750.
Expand Down
4 changes: 3 additions & 1 deletion pt/licoes/download-paginas-web-python.md
Original file line number Diff line number Diff line change
Expand Up @@ -32,7 +32,9 @@ doi: 10.46430/phpt0010

{% include toc.html %}


<div class="alert alert-warning">
O site do Old Bailey Online foi recentemente atualizado. Infelizmente, devido às diversas <a href="https://www.oldbaileyonline.org/about/whats-new">mudanças</a>, muitos (se não todos) os elementos do site de exemplo usado nesta lição não funcionarão conforme descrito. No entanto, as metodologias ensinadas por esta lição permanecem relevantes e podem ser adaptadas pelos leitores para um site de exemplo diferente. Estamos trabalhando na adaptação da lição para o novo site do Old Bailey Online, mas ainda não temos cronograma preciso de quando a lição será atualizada. [Abril de 2024]
</div>

### Objetivos da Lição

Expand Down
4 changes: 4 additions & 0 deletions pt/licoes/normalizacao-dados-textuais-python.md
Original file line number Diff line number Diff line change
Expand Up @@ -33,6 +33,10 @@ doi: 10.46430/phpt0029

{% include toc.html %}

<div class="alert alert-warning">
O site do Old Bailey Online foi recentemente atualizado. Infelizmente, devido às diversas <a href="https://www.oldbaileyonline.org/about/whats-new">mudanças</a>, muitos (se não todos) os elementos do site de exemplo usado nesta lição não funcionarão conforme descrito. No entanto, as metodologias ensinadas por esta lição permanecem relevantes e podem ser adaptadas pelos leitores para um site de exemplo diferente. Estamos trabalhando na adaptação da lição para o novo site do Old Bailey Online, mas ainda não temos cronograma preciso de quando a lição será atualizada. [Abril de 2024]
</div>

## Objetivos da Lição

A lista que criámos na lição [De HTML para Lista de Palavras (parte 2)](/pt/licoes/HTML-lista-palavras-2) precisa ser normalizada antes de poder ser utilizada. Faremos isso através da aplicação de alguns métodos de string adicionais, bem como utilizando expressões regulares. Uma vez normalizados, estaremos aptos a analisar os nossos dados mais facilmente.
Expand Down
Loading

0 comments on commit e7550d9

Please sign in to comment.