Skip to content

Latest commit

 

History

History
84 lines (44 loc) · 4.64 KB

4-Results.md

File metadata and controls

84 lines (44 loc) · 4.64 KB
title order
Results
4

The results of the experiment. See Figure 1 and Figure 2, as well as Table 1, for details.

Identificadores universais

OrcID

ResearchID

Redes de relacionamento

Linkedin

Research Gate

Editores de texto Markdown

ATOM

Typora

Publishing

Github

OSF - Open Science Framework

Gerenciadores de citações

Mendeley

Readcube

Extensões de pesquisa

Lazy Scholar

Unpaywall

Open Acess Button

Formatos de armazenamento

Texto puro

A série de caracteres conhecida como ASCII (American Standard Code for Information Interchange, ou Código Americano Padrão para Intercâmbio de Informações), foi a primeira padronização de armazenamento e exibição de texto da história da informática. Publicada em 1986, surgiu da evolução de um padrão telegráfico de 1967. Por meio de 7 bits, permite uma gama de 128 caracteres, dentre números, letras, sinais gráficos e sinalizadores digitais. Não inclui diacríticos (letras acentuadas).

O ASCII extendido (EASCII ou High ASCII) utiliza 8 bits, possibilitando 256 caracteres. Ainda é encontrado em uso. Inclui vários diacríticos próprios das línguas latinas ocidentais.

Com a computação deixando de ser exclusividade dos países de língua inglesa, mais linguagens precisaram ser comportadas e a solução encontrada à época foram as páginas de código. Utilizou-se as mesmas 256 possibilidades do ASCII extendido, mas cada arquivo passou a incorporar a indicação da página de código que utilizava. Sendo assim, os caracteres eram armazenados como unidades de informação variando de 0 a 255, mas eram exibidos de até 16 formas diferentes como por exemplo no padrão ISO/IEC 8859 que vai do ISO-8859-1 ao ISO-8859-16.

Criando ainda mais confusão, apesar de existir o padrão ISO, cada fabricante lançou suas próprias páginas de códigos, sendo muitas não documentadas.

É de se imaginar que um arquivo armazenado com determinada página de código não seria exibido da forma esperada em um sistema em funcionamento com uma página de código diferente. Ainda que em determinado ponto de desenvolvimento os sistemas passaram a incluir todas a mais utilizadas páginas de código, não era possível armazenar línguas diferentes no mesmo arquivo.

Com a globalização da informação, o consórcio Unicode publicou em 1992 o padrão UTF que permitiu a exibição fiel, e armazenamento, simultâneo de diferentes línguas no mesmo meio sem a preocupação de se estar utilizando a página de códigos correta para a exibição. Se um caracter for armazenado como UTF, só há uma possibilidade projetada de exibi-lo.

Este padrão é atualmente o mais utilizado devido a expansão global da World Wide Web que implicou em grande troca de informações entre os vários países. É capaz de representar 1.112.064 unidades de informação no armazenamento UTF-8 e é compatível com o ASCII.

Com uma possibilidade tão grande de representações, o consórcio Unicode tem acrescentado continuamente caracteres, gerando versões do padrão inicial, mantendo-se, no entanto, compatível com as anteriores.

Redação: Markdown

Dados: CSV - Comma Separated Value

Em inglês "Dados Separados por Vírgula". São arquivos de texto puro com informações organizadas de forma análoga a uma planilha, organizada em linhas e colunas, onde cada série de dados, as linhas da planilha, é separada por uma nova linha e cada unidade de dados, as colunas da planilha, é separada por vírgulas ou por outro caracter único pré-determinado.

Comumente a primeira linha de um arquivo CSV contém uma série de dados que dão nome às colunas.

Menos comumente, a segunda linha contém uma série de dados que dão informações sobre estas colunas, tais como identificar o tipo dos dados, se são texto ou números, a precisão dos números exibidos, número de casas decimais.

Imagens e arquivos binários

Não é possível recomendar um formato de armazenamento de imagens que seja seguro quanto a durabilidade de seu algoritmo. Do mesmo modo que arquivos binários, o armazenamento de uma imagem esta completamente ligado ao sistema de exibição.

Os arquivos de imagem conhecidos como RAW (cru, em inglês) contêm informações puras não tratadas ou compactadas da imagem gerada por determinado dispositivo de captura e por isso estão atrelados a tal equipamento. Não são uma forma viável de armazenamento de longíssimo prazo visto que dependem de algoritmo mutável com o dispositivo para interpretação e exibição dos dados.