opensci:2022:trab1
Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anteriorRevisão anterior | |||
opensci:2022:trab1 [2024/04/10 18:25] – lcer | opensci:2022:trab1 [2024/04/10 18:31] (atual) – lcer | ||
---|---|---|---|
Linha 14: | Linha 14: | ||
{{: | {{: | ||
- | + | ===== Open Forestry | |
- | < | + | |
< | < | ||
Linha 156: | Linha 155: | ||
* Como a Universidade está se preparando para essa tendência? | * Como a Universidade está se preparando para essa tendência? | ||
{{youtube> | {{youtube> | ||
+ | |||
+ | ====== Tidyverse====== | ||
+ | ==Por: Evandro Magalhães, Guilherme Landim e Jorge Monteiro== | ||
+ | |||
+ | |||
+ | '' | ||
+ | “Conjuntos de dados Tidy são todos iguais, mas todo conjunto de dados bagunçados são únicamente bagunçados.” –– Hadley Wickham | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | ==== O que é a filosofia Tidy?==== | ||
+ | |||
+ | < | ||
+ | <p align=" | ||
+ | |||
+ | Os princípios para a elaboração de dados limpos através de uma interface uniforme permite a dominação de um pacote que pode ser interligado à lógica | ||
+ | de outro. O tidyverse parte de uma base “crua” e a transformam até obter uma base de dados analítica, que, a menos de transformações simples, está preparada para | ||
+ | gerar tabelas e gráficos e alimentar modelos. O Tidyverse é um conjunto de pacotes para ciência de dados que possuem gramática, estrutura de dados e principalmente, | ||
+ | uma filosofia em comum. A filosofia é de trabalhar sempre com dados tidy (arrumados) e ter todas as ferramentas para transformar os dados que tivermos em tidy. | ||
+ | |||
+ | </ | ||
+ | |||
+ | O tidyverse segue os seguintes princípios para uma [[https:// | ||
+ | |||
+ | ===Reutilizar estruturas de dados existentes=== | ||
+ | |||
+ | < | ||
+ | <p align=" | ||
+ | |||
+ | Quando possível, é melhor utilizar estruturas de dados comuns do que criar uma estrutura específica para o seu pacote. | ||
+ | Geralmente, é melhor reutilizar uma estrutura existente mesmo que ela não se encaixe perfeitamente. | ||
+ | |||
+ | </ | ||
+ | |||
+ | ===Organizar funções simples usando o pipe=== | ||
+ | |||
+ | < | ||
+ | <p align=" | ||
+ | O pipe, %>%, é uma ferramenta de composição comum que funciona em todos os pacotes. Faça com que suas funções sejam o mais simples possíveis. Com o pipe é possível programar de forma mais compacta, legível e correta. Uma função deve poder ser descrita com apenas uma sentença. | ||
+ | A sua função deve fazer uma transformação no estilo copy-on-modify ou ter um efeito colateral. Nunca os dois. | ||
+ | O nome das funções devem ser verbos. Exceto quando as funções do pacote usam sempre o mesmo verbo. Ex: adicionar ou modificar. | ||
+ | </ | ||
+ | ===Programação Funcional=== | ||
+ | |||
+ | < | ||
+ | <p align=" | ||
+ | O tidyverse trata de um conjunto de pacotes lógicos que combina a manipulação de vetores para a visualização de dados em mapas para gerar uma comunicação sobre | ||
+ | o fenômeno que o ocorre com a combinação dos fatores que aqueles dados possuem. | ||
+ | Esta manipulação combinada é dado pela exploração algébrica dos conjuntos numéricos para a formação de equações que possam entender as variáveis ajustadas de acordo | ||
+ | com a lista de dados que foi obtida através da dinâmica do processamento do código. | ||
+ | A visualização combinada destes dados é ralizado por visulizações geométricas em diferentes escalas de acordo com a equação lógica atribuida, informando a posição dos vetores | ||
+ | distribuidos de acordo com a matemática atribuída para o entendimento do fenômeno a ser explorado. | ||
+ | Cada pacote do tidyverse lida com um diferente tipo de lógica. | ||
+ | </ | ||
+ | ===Projetado para ser usado por seres humanos=== | ||
+ | < | ||
+ | <p align=" | ||
+ | Desenvolva o seu pacote para ser usado por humanos. Foque em ter uma API clara para que você escreva o código de maneira intuitiva e rápida. | ||
+ | Eficiência dos algoritmos é uma preocupação secundária, | ||
+ | </ | ||
+ | |||
+ | |||
+ | |||
+ | Em resumo, toda variável está em uma coluna, e toda coluna é uma variável! | ||
+ | |||
+ | |||
+ | ==== Quais são as regras para ser Tidy?==== | ||
+ | |||
+ | O padrão a ser seguido para a criação de dados e tabelas Tidy são em essência simples: | ||
+ | - Cada variável é uma coluna | ||
+ | - Cada observação é uma linha | ||
+ | - Cada tipo de unidade observacional é uma tabela | ||
+ | |||
+ | |||
+ | < | ||
+ | <p align=" | ||
+ | Neste contexto, dados que não obedeçam esse conjunto de regras são considerados bagunçados (messy data). | ||
+ | </ | ||
+ | |||
+ | De acordo com [[http:// | ||
+ | |||
+ | |||
+ | - Os cabeçalhos são valores, não o nome das variáveis; | ||
+ | - Multiplas variáveis estão armazenadas na mesma coluna; | ||
+ | - Variáveis armazenadas tanto em linhas, como em colunas; | ||
+ | - Diferentes tipos de unidades observacionais estão armazenadas na mesma tabela; | ||
+ | - Uma única unidade observacional está armazenada em diferentes tabelas. | ||
+ | |||
+ | |||
+ | ==== O que é tidyverse? | ||
+ | < | ||
+ | <p align=" | ||
+ | O Tidyverse é uma coletânea de pacotes que podem facilmente ser instaladas pelo aglomerador de pacotes chamado '' | ||
+ | </ | ||
+ | |||
+ | |||
+ | ==== Pacotes do Tidyverse==== | ||
+ | < | ||
+ | <p align=" | ||
+ | No dia a dia cheio de análises de uma cientista de dados, provavelmente ela utilizará um dos pacotes do universo Tidy. Estes são: | ||
+ | </ | ||
+ | |||
+ | '' | ||
+ | |||
+ | '' | ||
+ | |||
+ | '' | ||
+ | |||
+ | '' | ||
+ | |||
+ | '' | ||
+ | |||
+ | |||
+ | '' | ||
+ | </ | ||
+ | |||
+ | '' | ||
+ | |||
+ | '' | ||
+ |
opensci/2022/trab1.1712773542.txt.gz · Última modificação: 2024/04/10 18:25 por lcer