terça-feira, 29 de abril de 2008

sexta-feira, 18 de abril de 2008

IDH (HDI)

O Índice de Desenvolvimento Humano (Human Development Index) é certamente dos indicadores mais frequentemente utilizados nas comparações internacionais. Descarregue os dados mais recentes disponíveis em folhas de Excel, no endereço http://hdr.undp.org/en/statistics/data/.
1) Utilizando apenas os países de desenvolvimento humano elevado (os primeiros 70), calcula uma matriz de correlações entre as diversas variáveis:



















2) Comenta os coeficientes de correlação mais significativos.
3) Justifica a opção por trabalhar apenas com os países de desenvolvimento elevado.
R: Pelo facto destes 70 países pertencerem ao grupo com maoir índice de desenvolvimento humano, e por apresentarem valores mais homogéneos.
4) Investigue outras variáveis susceptíveis de explicar o desenvolvimento humano, explorando os indicadores contidos no Relatório do Desenvolvimento Humano (ficheiro hdr_20072008_tables.zip).

quinta-feira, 17 de abril de 2008

COEFICIENTE DE CORRELAÇÃO DE PEARSON - r

Quando tomamos as variáveis duas a duas podemos verificar o que sucede a uma variável, x, quando outra variável, y, varia. São então possíveis três situações particularmente interessantes: a) Quando a variável x toma valores maiores (menores) a variável y também toma valores maiores (menores); b) Quando a variável x toma valores maiores (menores) a variável y toma valores menores(maiores); c) A variável x toma valores maiores (menores) independentemente dos que a variável y apresenta. No primeiro caso diremos que as variáveis estão positivamente (ou directamente) correlacionadas. No limite, isto é, se a correlação for "perfeita" - como é o caso se considerarmos a correlação da variável x consigo própria - o coeficiente de correlação será igual a 1. No segundo caso diremos que as variáveis estão negativamente (ou inversamente) correlacionadas. No limite, isto é, se a correlação for "perfeita" o coeficiente de correlação será igual a -1. No terceiro caso diremos que as variáveis não estão correlacionadas. No limite, isto é, em caso de "absoluta independência" o coeficiente de correlação será igual a 0. Na prática os valores acima indicados nunca se encontram, mas são estes que deverão tomar-se como referência na interpretação dos parâmetros obtidos.




EXERCÍCIOS:



0) - Indique uma justificação para a redução da base de dados acima solicitada.




R: O motivo de se selecionarem apenas 100 registos, é pela simplificação da representação gráfica.




3) - Verifique que a disciplina de Biologia é aquela que evidencia maior correlação. Simultâneamente estes professores seriam os primeiros a ser "crucificados" pela diferença CIF-CE! Tente explicar esta aparente contradição.
R: Significa que os alunos que têm melhores notas no exame, já tinha tido ainda notas melhores em CFI'S.


2) GRÁFICOS DE DISPERSÃO:






































QUADRO SÍNTESE:




terça-feira, 1 de abril de 2008

MÉDIA E DESVIO PADRÃO - EFEITO DA ADIÇÃO E DA MULTIPLICAÇÃO DE UMA CONSTANTE





















1. Calcule a média utilizando a fórmula do Excel, MEDIA.

2. Calcule o desvio padrão utilizando a fórmula do Excel, DESVPADP.

3. Atribua mais 2 valores a cada um dos alunos, e recalcule a média e o desvio padrão.

4. Regressando à distribuição inicial, multiplique cada um dos valores por 3, e recalcule a média e o desvio padrão.

5. Comente os resultados que obteve.

Verifico que após adição de 2 valores, não houve alteração no que diz respeito ao desvio padrão, em relação a média, verifico que o valor também aumenta 2 valores. Os resultados apresentados após a multiplicação por 3 valores, tanto no desvio padrão como na média triplicaram os valores.

MEDIDAS DE ASSIMETRIA E DE ACHATAMENTO

As medidas de assimetria permitem distinguir as distribuições simétricas (Média = Moda = Mediana) das assimétricas. No caso das distribuições assimétricas estas podem ter assimetria positiva (Moda <= Mediana <= Média) ou assimetria negativa (Média <= Mediana <= Moda).

Para qualquer dos indicadores, uma distribuição simétrica resultará num valor igual a 0 (zero);Se a distribuição for assimétrica positiva resultará num valor superior a 0 (zero); Se a distribuição for assimétrica negativa resultará num valor inferior a 0 (zero).O achatamento ou curtose mede o grau de afilamento da curva relativamente à normal.


1) Continuando a utilizar os dados referentes ao Exames Nacionais de 2003, calcula os indicadores de assimetria (G, G1 e G2) e de achatamento (K) da distribuição das CIF e da distribuição das CE, em:





RANKING DE ESCOLAS

Verifica se são verdadeiras as seguintes afirmações:
1) média CE é menor que a média CIF em todas as disciplinas -Verdadeiro

2) desvio padrão das CE é maior que o desvio padrão das CIF em todas as disciplinas - Verdadeiro

3) médias CE são mais baixas no grupo Matemática e Ciências que em Português e Literárias - Verdadeiro

4) desvios padrão dos CE são maiores no grupo Matemática e Ciências que em Português e Literárias - Verdadeiro

5) diferença média CIF – média CE é maior no grupo Matemática e Ciências que em Português e Literárias - Verdadeiro


Rankings de Escolas - Quadro Síntese