This a new word list for generating prettier (and hopefully then more memorable) Spanish language passphrases using diceware.
This is still alpha, not ready for use.
This includes a list of 7776 words with corresponding five-dice throw results. You can of course generate passphrases any way you want, but throwing dice alone in a room is a very secure way to do it. It's probably a good idea to conjugate any verbs that appear to make the phrase even more readable. I may write a specific prescriptive way to do that.
This particular word list was generated using a corpus of the most common words in Spanish, assembled using a proportion of nouns, verbs, adjectives and adverbs similar to that found in written texts, specifically:
- nouns: 55% (4277 words)
- verbs: 23% (1788 words)
- adjectives: 17% (1322 words)
- adverbs: 5% (389 words)
These proportions were derived from some tagged corpora of Spanish texts. Using the top most used words plus the above proportions seems to generate prettier and more readable passphrases.
I have tried to remove nasty and potentially controversial words from the list. The corpus is the Sadowsky and Martínez word frequency list of Chilean Spanish[^0], therefore there is still a certain Chilean slant to the list, even after cleaning up some arcane words. I have included some of the source material so that if more words are removed the source can be used to fill in the blanks. This includes some "glue" words that maybe can be prescriptively added somehow.
Esta es una nueva lista de palabras para generar frases de paso más bonitas (y con suerte más memorables) usando diceware o dadoware.
Esto todavía está en versión alfa, no está listo para su uso.
Se incluye una lista de 7776 palabras con sus correspondientes resultados del tiro de 5 dados. Puedes por supuesto usar esta lista para generar frases de paso como quieras, pero tirar dados a solas en un cuarto es una manera muy segura de hacerlo. Puede ser una buena idea conjugar los verbos que aparezcan para hacer la frase aún más legible. Puede que en algún momento escriba una manera específica prescriptiva de hacer esto.
Esta lista de palabras en particular fue generada usando un corpus de las palabras más comunes en español, ensamblado usando una proporción de sustantivos, verbos, adjetivos y adverbios similar a la que se encuentra en textos escritos, específicamente:
- sustantivos: 55% (4277 palabras)
- verbos: 23% (1788 palabras)
- adjetivos: 17% (1322 palabras)
- adverbios: 5% (389 palabras)
Estas proporciones fueron derivadas de algunos corpora etiquetados de textos en español.
Usar las palabras más comunes junto a las proporciones mencionadas parece generar frases de paso bonitas y más o menos legibles.
He tratado de quitar palabras feas y potencialmente controversiales de la lista. El corpus es la Lista de frecuencias de palabras del castellano de Chile de Sadowsky y Martínez [^0], por lo que hay todavía un cierto sesgo chileno en la lista, aún después de limpiar algunas palabras arcanas. He incluido parte del material fuente de manera tal que si se quitan más palabras tengamos con qué llenar los vacíos. Se incluyen aquí algunas palabras "goma" que quizá puedan ser prescriptivamente agregadas de alguna manera.
[^0] Copyright © 2006, 2012 Scott Sadowsky & Ricardo Martínez Gamboa Todos los derechos reservados. All Rights Reserved. Inscripción No 154.198 (Chile).