Data Types:
- Numéricos ⇒ Representa uma medida quantitativa
- Categóricos ⇒ Dados qualitativos que não têm necessariamente um significado matemático. Podemos, designar números para as categorias, para representar ser mais compacto de representar, embora esse números não tenham um significado matemático.
- Ordinal ⇒ Mistura entre numéricos e categóricos. Dados categóricos mas com um significado matemático.
- Mean - Média ⇒ soma / n° total de valores
- Median - Mediana ⇒ Ordenar os valores e buscar o valor do meio
- Mode - Moda ⇒ Valor que mais vezes aparece na distribuição
A mediana é menos suscetível a outliers que a média. Se não houver outliers, a média já seria melhor que a mediana
- Variância ⇒ Diz até que ponto os valores variam
- Primeiro calcula-se a média
- Encontra-se todas as diferenças entre cada valor e a média
- Calcular os quadrados dessas diferenças
- Calcular a média desses valores
- Desvio de Padrão (DP)
- Raiz quadrada da Variância
Permite detetar outliers e quando mais afastado do desvio de padrão, maior o outlier
Função de densidade probabilidade
- Distribuição normal → É simétrica e a maioria dos valores se encontram entre -DP e +DP
Com valores discretos, fazer o histograma e depois usar isso para fazer a função