Uso de dados do Repositório Figshare
O Figshare é um repositório online que contém dados de pesquisas publicadas em periódicos. É um plataforma aberta, que permite o acesso ao banco de dados e planilhas utilizados em artigos. No entanto, é necessário verificar quais dados e como estão disponibilizados. No caso de artigos voltados para qualidade do leite e mastite em vacas leiteiras, alguns repositórios apresentaram dados de tabelas já processados, como por exemplo médias, medianas, desvio padrão, etc. Nesse caso, não é possível aplicar quaisquer tipo de análise. Portanto, considerando o conceito de open science, dados já manipulados não podem ser utilizados.
O artigo escolhido foi Bovine mastitis: prevalence, risk factors and isolation of Staphylococcus aureus in dairy herds at Hawassa milk shed, South Ethiopia. Um exemplo do dataset bruto:
A mastite é uma inflamação da glândula mamária em vacas leiteiras, geralmente ocorrendo em vacas de alta produção. Essa inflamação pode ser causada por choques mecânicos, mas cerca de 80% dos casos de mastite são causados por patógenos, em sua maioria bactérias (Gonçalves et al., 2018). No artigo escolhido, os autores tiveram como objetivo identificar os fatores de risco envolvidos na mastite bovina causada por Staphylococcus aureus, uma bactéria de grande importância na mastite bovina principalmente pelo seu comportamento contagioso e de difícil controle. Essa espécie possui capacidade de formação de cistos na glândula mamária, dificultando a ação de antimicrobianos intramamários e garantindo a sobrevivência da bactéria (Cornell University, 2024). Essa característica confere à espécie a capacidade de sobrevivência e possível adaptação aos antimicrobianos, surgindo assim a resistência aos antimicrobianos/superbactérias, um problema de saúde pública. Assim, entender os fatores de risco envolvidos na mastite bovina causada por S. aureus é uma forma eficaz e preventiva para evitar o contágio dessa bactéria entre animais sadios e doentes durante a ordenha.
Análise Exploratória dos Dados
O dataset contém variáveis como id da vaca, código da fazenda, tipo de sistema de produção, sistema de alojamento, tipo de cama, características de limpeza de úbere (tipo de limpeza e secagem), quantidade de vacas em lactação, raça, estágio de lactação, idade, produção de leite, frequência de ordenha, histórico de mastite, resultado microbiológico, entre outras.
Abaixo, uma visualização da estrutura dos dados: