Blog, portfolio & snippets

Aqui reservo um espaço para postar assuntos relacionados à ciência de dados em geral em uma espécie de blog. Também tenho incluído aqui alguns posts para ajudar colegas e amigos a entenderem algumas ferramentas básicas de R e análise de dados, que podem auxiliar em suas pesquisas, além de servirem como snippets para eu mesmo. Todo código utilizado aqui pode ser conferido no repositório deste site (na pasta do blog)! Para projetos de meu portfolio de trabalho & consultoria, conto com uma sessão separada (projetos).

Testando múltiplos modelos supervisionados & tunados!

Comparando três modelos supervisionados de classificação usando uma busca em grid para tunar hiperparâmetros, também testando dados pré-processados de maneira distinta e com diferentes fórmulas. Tudo isso de maneira automatizada usando o framework do tidymodels!

Data viz: eixo y duplo!

Post de leitura rápida, mostrando como construir um (não recomendado) plot com eixo y duplo, com escalas diferentes. Pode ser útil em casos específicos.

Segmentação de dados - Parte 1

Primeiro post de uma série mostrando como aplicar o algoritmo não supervisionado K-prototypes, para segmentar dados de diversos tipos.

Histórico de descrições de plantas brasileiras

Pequena análise temporal da taxa de descrição de plantas brasileiras. Nela observo como o número de descrições se comportou ao longo dos anos, a diferença entre os séculos, grupos taxonômicos e entre os estados brasileiros.

Regressão Logística Binomial

Exercício aplicando stepwise regression usando dados de doenças cardíacas, em uma regressão logística binomial. Aqui também discuto brevemente curvas ROC, AUC, acurácia e sua relação com o desbalanço de classes.

Regressão Linear Simples - Fish Market data

Pequena regressão simples usando medidas de peixes de um mercado. Exploro a regressão, fatores que influenciam na qualidade dela e identifico a colinearidade de algumas variáveis.