O documento descreve os quartis, que são valores que dividem uma distribuição de frequências em quatro partes iguais. Os quartis Q1 e Q3 dividem a distribuição em 25% e 75% respectivamente. O documento também fornece um exemplo numérico ilustrando o cálculo dos quartis.
PROJETO DE EXTENSÃO I - AGRONOMIA.pdf AGRONOMIAAGRONOMIA
Estatística Descritiva - parte 2 (ISMT)
1. Os quartis são os valores da variável que dividem a
distribuição de frequências em quatro partes iguais.
...
Os decis em dez.
...
Os percentis em cem.
...
0 0,25 0,5 0,75 1,00 cum fi
Q1 Q2 Q3 Xi
www.joaoleal.net Professor: João José Leal 57
2. Quartis
Conforme se viu anteriormente, a mediana é o
valor que divide a distribuição em duas partes iguais.
Os quartis são os valores que dividem a
distribuição em quatro partes iguais.
www.joaoleal.net Professor: João José Leal 58
3. Exemplo 11: Tamanho dos N.º de pares
sapatos vendidos cum ni fi (%) cum fi (%)
Xi ni
35 30 30 0,65 0,65
35,5 40 70 0,87 1,52
36 50 120 1,08 2,60
36,5 150 270 3,25 5,86
37 300 570 6,51 12,37
Q1 37,5 600 1170 13,02 25,38
38 950 2120 20,61 46,00
Q2 38,5 820 2940 17,79 63,79
Q3 39 750 3690 16,27 80,06
39,5 440 4130 9,55 89,61
40 250 4380 5,42 95,03
40,5 150 4530 3,25 98,29
41 40 4570 0,87 99,15
41,5 39 4609 0,85 100,00
4.609 100,00
www.joaoleal.net Professor: João José Leal 59
4. Diagrama de Extremos e Quartis
Utiliza-se para representar a mediana, a dispersão
inter-quartil, as observações máximas e mínimas e os
outliers.
www.joaoleal.net Professor: João José Leal 60
5. Exercícios:
1. As classificações obtidas pelo Vítor no teste de Matemática foram:
55% 65% 55% 70% 72%
1.1 Qual foi a classificação média?
1.2 Qual é a moda?
1.3 Qual é a mediana?
1.4 O Vítor fez um 6º teste e obteve a classificação de 80%.
a) Qual é a média dos seis testes?
b) Qual é a classificação mediana dos seis testes?
www.joaoleal.net Professor: João José Leal 61
6. Medidas de Dispersão
As medidas de localização não caracterizam a dispersão ou
a variabilidade dos dados. É então necessário considerar medidas de
estatísticas que descrevam tal dispersão, pois ela desempenha um
papel importante na explicação de um fenómeno ou acontecimento.
A amplitude, a variância e o desvio padrão são
normalmente conhecidos como medidas de dispersão.
www.joaoleal.net Professor: João José Leal 62
7. Amplitude total
Num conjunto de dados chama-se amplitude total ou apenas
amplitude à diferença entre o maior e o menor valor da variável.
Se os dados estão agrupados em classes, a amplitude é a
diferença entre o limite superior da última classe e o limite inferior
da primeira classe.
www.joaoleal.net Professor: João José Leal 63
8. Exemplos:
1. As notas do João nas disciplinas de português, Filosofia,
Matemática e Inglês foram: 10 16 18 8
O maior destes valores é 18 e o menor é 8. Deste modo, a amplitude
do conjunto de dados é:
A = 18 - 8 = 10
2. Considerando o exemplo do levantamento da área total das
divisões de cada uma das casas de uma aldeia e os resultados forma
os seguintes: Classes fi
[50, 100[ 25
[100, 150[ 55 A 300 50 250
[150, 200[ 92
[200, 250[ 71
[250, 300[ 57
Total 300
www.joaoleal.net Professor: João José Leal 64
9. Amplitude interquartis é a diferença entre o 3º e o 1º quartis e
representa-se por:
AQx = Q3 – Q1
Esta medida é mais útil do que a amplitude, pois dá-nos informação
sobre a amplitude do intervalo em que se encontram 50 % das
observações centrais
www.joaoleal.net Professor: João José Leal 65
11. Variância
A medida de dispersão mais utilizada é o desvio- padrão. No entanto,
para obter o desvio- padrão temos de determinar primeiro a variância.
Variância: Sendo x1, x2, ..., xn os n valores de um variável
quantitativa e x a média, chama-se variância, e representa-se por 2
n
ao valor dado pela fórmula:
xi x
2
Para dados não classificados: 2 i 1
n
n
fi xi x
2
Para dados classificados: 2 i 1
n
www.joaoleal.net Professor: João José Leal 67
12. Exemplo:
Exemplo:
Observe o conjunto de dados correspondentes às classificações
obtidas no 9º ano, em cinco testes, por dois irmãos: o José e a Maria.
Vamos calcular, para cada um dos conjuntos de dados, a variância.
Começa-se por calcular a média:
www.joaoleal.net Professor: João José Leal 68
14. Ou, relativamente às notas da Maria nós tínhamos:
xi fi xi x xi x
2
f i xi x
2
2 1 2-3 = -1 1 1
2
1 1 1
3 3 3-3 = 0 02 0 3 0 0
4 1 4-3 = 1 12 1 1 1 1
f x x 2
2
Total 5 i i
Assim,
2
0, 4
2
5
www.joaoleal.net Professor: João José Leal 70
15. Desvio-padrão: O desvio-padrão, que se representa por , é igual
à raiz quadrada positiva da variância, ou seja:
• Para dados não classificados: n
xi x
2
i 1
n
• Para dados classificados: n
f i xi x
2
i 1
n
www.joaoleal.net Professor: João José Leal 71
16. Exemplo:
Exemplo:
Considerando as notas do José e da Maria, o desvio-padrão
seria, respectivamente:
2 1, 4 1c.d e 0, 4 0,6 1c.d
www.joaoleal.net Professor: João José Leal 72
17. Propriedades do desvio-padrão
desvio-
•O desvio-padrão é sempre não negativo.
•Quanto maior for o desvio-padrão maior será a dispersão dos dados
em relação à média.
•Se o desvio-padrão é igual a zero é porque não existe variabilidade,
isto é, os dados são todos iguais.
www.joaoleal.net Professor: João José Leal 73
18. Distribuições bidimensionais
No estudo da estatística, até agora desenvolvido,
estudámos variáveis estatísticas isoladamente, isto é, a
cada observação correspondia um registo e depois eram
trabalhados esses registos. A variável estatística era
unidimensional.
www.joaoleal.net Professor: João José Leal 74
19. Assim,
Definição de distribuição unidimensional: É aquela em que a
observação é apenas feita atendendo a uma variável.
Porém, o que se pretende estudar da população não é só
essa variável, mas sim averiguar se há alguma relação entre duas
ou mais características da população.
www.joaoleal.net Professor: João José Leal 75
20. Definição de distribuição bidimensional: Quando a população é
estudada relativamente a duas variáveis.
Nota: Quando se pretende estudar duas características ao mesmo tempo, a
cada observação correspondem dois valores.
Assim, os valores aparecem como pares ordenados (x, y).
www.joaoleal.net Professor: João José Leal 76
21. Exemplos deste tipo de situações:
Averiguar se há uma relação entre:
1) o peso e a altura dos alunos de uma determinada turma;
2) as alturas dos progenitores e dos seus filhos adultos.
www.joaoleal.net Professor: João José Leal 77
22. Relação funcional: É quando existe uma relação exacta entre duas
variáveis, isto é, é possível determinar com precisão a relação
existente entre duas variáveis.
Exemplo:
A área de um quadrado e o comprimento do seu lado.
Estas duas variáveis estão relacionadas, a relação que as liga é bem definida,
invariável e pode ser traduzida pela expressão matemática: A=l2, representando A a
área e l o lado.
Podemos, assim dizer que esta relação permite determinar, com a precisão desejada,
a área de um quadrado a partir do comprimento do seu lado ou vice-versa.
www.joaoleal.net Professor: João José Leal 78
23. Relação estatística: É quando a relação é menos precisa, mais
vaga, e sujeita a mais variações.
Exemplo:
As idades dos cônjuges na data do casamento.
A idade do marido, não pode ser determinada com exactidão a partir da idade da
mulher. Pois, o que se pode dizer é que em média quanto mais velho é o marido mais
velha será também a mulher. No entanto, em alguns casos, o marido pode ser mais
novo ou ter a mesma idade da mulher.
www.joaoleal.net Professor: João José Leal 79
24. Assim, perante dois fenómenos quaisquer, pode-se afirmar
que ou estão ligados através de uma relação funcional ou de uma
relação estatística, ou não estão ligados através de qualquer relação.
No caso da ausência de qualquer relação entre dois
fenómenos, estes dizem-se independentes.
www.joaoleal.net Professor: João José Leal 80
25. Diagrama de dispersão
Definição: Chama-se diagrama de dispersão a uma nuvem
de pontos obtidos após a representação num sistema de eixos dos
pontos correspondentes aos pares ordenados (x, y) [as duas
variáveis]. y
x
www.joaoleal.net Professor: João José Leal 81
26. Correlação linear ou Coeficiente de correlação
Quando se observa um diagrama de dispersão, intuitivamente
é-se levado a afirmar que existe ou não existe a possibilidade de
qualquer relação entre as variáveis.
Se os pontos se concentrarem à volta de uma linha recta é
porque existe uma relação entre as variáveis (correlação linear).
Definição de correlação: A correlação é a teoria que estuda a
intensidade da relação ou a dependência entre as duas variáveis
de uma distribuição bidimensional.
www.joaoleal.net Professor: João José Leal 82
28. A intensidade da relação existente entre as
variáveis x e y pode ser quantificada. Para quantificar
essa relação Pearson propôs o coeficiente de
correlação linear de Pearson.
www.joaoleal.net Professor: João José Leal 84
29. O coeficiente de correlação é um número do intervalo [-1, 1] e
é representado por r ou rxy e definido por:
n
x x y y
i i
r i 1
n n
x x y y
2 2
i i
i 1 i 1
sendo xi valores das observações de uma das variáveis, yi os
valores das observações correspondentes da outra variável, x éa
média das observações de xi e y é a média das observações de yi.
www.joaoleal.net Professor: João José Leal 85
30. Conhecido o valor de r avalia-se a intensidade da correlação
de acordo com a seguinte escala.
www.joaoleal.net Professor: João José Leal 86
33. Recta de regressão.
Considerem-se os seguintes diagramas de dispersão:
Figura 1: Todos os pontos do diagrama de
dispersão estão sobre uma recta, o que significa
que existe um ajustamento perfeito entre os pontos
da recta. Esta situação representa graficamente
uma relação funcional.
www.joaoleal.net Professor: João José Leal 89
34. Figura 2: Verifica-se que os pontos se situam em
torno de uma recta imaginária que passa através da
nuvem de pontos.
www.joaoleal.net Professor: João José Leal 90
35. Figura 3: A linha que se ajusta à nuvem é uma
parábola.
www.joaoleal.net Professor: João José Leal 91
36. Figura 4: As variáveis não estão relacionadas. A
dispersão dos pontos é muito irregular.
www.joaoleal.net Professor: João José Leal 92
37. Notas:
1. A recta de regressão pode ser definida por uma equação ( yaxb ).
2. Vantagem do conhecimento da recta de regressão:
Permite determinar uma estimativa do valor de uma das
variáveis conhecido o valor da outra variável.
www.joaoleal.net Professor: João José Leal 93
38. 3. A recta de regressão contém o ponto ( x , y ) , sendo x e y as
médias das variáveis x e y, respectivamente. Este conhecimento
permite construir a recta com um menor erro.
www.joaoleal.net Professor: João José Leal 94
39. Medidas de assimetria
Assimetria
O método mais simples de reconhecer a assimetria de uma
distribuição consiste na observação das posições relativas da média,
mediana e moda e na comparação dos seus valores.
x = Me = Mo Mo < Me < x x < Me < Mo
simetria assimetria positiva assimetria negativa
x – Mo = 0 x – Mo > 0 x – Mo < 0
www.joaoleal.net Professor: João José Leal 95
40. Exercícios:
1. A temperatura média anual e a latitude das capitais dos países da
EU aproximadamente a seguinte:
Capitais Temperatura Latitude (º)
(ºC)
Lisboa 19 39
Madrid 19 40
Paris 15 49
Londres 14 53
Amesterdão 13 54
Bruxelas 14 52
Luxemburgo 14 50
Bona 13 52
Roma 22 42
Atenas 24 37
Dublin 13 53
Copenhaga 11 54
www.joaoleal.net Professor: João José Leal 96
41. 1.1 Calcule a média das variáveis temperatura e latitude.
1.2 Desenhe o diagrama de dispersão e a recta de regressão
passando no ponto x , y Capitais Temperatura Latitude
(ºC) (º)
Lisboa 19 39
Madrid 19 40
Paris 15 49
Londres 14 53
Amesterdão 13 54
Bruxelas 14 52
Luxemburgo 14 50
Bona 13 52
Roma 22 42
Atenas 24 37
Dublin 13 53
Copenhaga 11 54
www.joaoleal.net Professor: João José Leal 97