Distancia {MultivariateAnalysis}R Documentation

Distancia de dissimilaridade

Description

Esta funcao retorna a distancia de dissimilaridade.

Usage

Distancia(Dados,Metodo,Cov=NULL)

Arguments

Dados

Matriz contendo os dados para calculo das distancias. Nas linhas devem estar os tratamentos, e nas colunas as variaveis respostas. Neste arquivo nao deve ter a identificacao dos tratamentos.

Metodo

Valor numerico indicando o metodo a ser utilizado:

  • Dados quantitativos

    • 1 = Distancia euclidiana.

    • 2= Distancia euclidiana media.

    • 3 = Quadrado da distancia euclidiana media.

    • 4 = Distancia euclidiana padronizada.

    • 5 = Distancia euclidiana padronizada media.

    • 6 = Quadrado da distancia euclidiana padronizada media.

    • 7 = Distancia de Mahalanobis.

    • 8 = Distancia de Cole Rodgers.

  • Dados qualitativos: binarios ou multicategoricos

    • 9 = Frequencia de coincidencia.

    • 10 = Frequencia de discordancia.

    • 11 = indice Inverso de 1+coincidencia = 1/(1+c)

  • Dados qualitativos binarios

    • 12 = Dissimilaridade de Jacard: 1-a/(a+b+c).

    • 13 = Dissimilaridade de Sorensen Dice: 1-2a/(2a+b+c).

    • 14 = Dissimilaridade de Sokal e Sneath: 1-2(a+d)/(2(a+d)+b+c)

    • 15 = Dissimilaridade de Roger e Tanimoto: 1-(a+d)/(a+2(b+c)+d)

    • 16 = Dissimilaridade de Russel e Rao: 1-a/(a+b+c+d).

    • 17 = Dissimilaridade de Ochiai: 1-a/sqrt((a+b)(a+c)).

    • 18 = Dissimilaridade de Ochiai II: 1-ab/sqrt((a+b)(a+c)(b+d)(c+d)).

    • 19 = Dissimilaridade de Haman: 1-((a+d)-(b+c))/(a+b+c+d).

    • 20 = Dissimilaridade de Yule: 1-(ad-bc)/(ad+bc).

  • Dados mistos

    • 21 =Dissimilaridade de Gower

    • 22 =Dissimilaridade de Gower 2

Cov

matriz quadrada e simetrica contendo as variancias e covariancias (residuais) entre as caracteristicas. Necessaria apenas para calculo da distancia de Mahalanobis.

Details

Um problema do indice de Gower (Metodo = 21) e que quando as variaveis binarias (0 ou 1) indicam a presença ou ausencia de bandas a informação 0-0 (ausencia de bandas em ambos os individuos) indica que os dois individuos sao iguais, o que nao e verdade necessariamente. Caso queira desconsiderar essas informações (0-0) no computo da dissimilaridade, pode-se usar o "indice de Gower 2" (Metodo =22)).

Value

A funcao retorna a distancia estimada entre os tratamentos.

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)

FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)

HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)

See Also

dist

Examples

data(Dados.MED)
##########> Dados quantitativos
#1 = Distancia euclidiana.
Distancia(Dados.MED,1)
#2 = Distancia euclidiana media.
Distancia(Dados.MED,2)
#3 = Quadrado da distancia euclidiana media.
Distancia(Dados.MED,3)
#4 = Distancia euclidiana padronizada.
Distancia(Dados.MED,4)
#5 = Distancia euclidiana padronizada media.
Distancia(Dados.MED,5)
#6 = Quadrado da distancia euclidiana padronizada media (Dados Quantitativos)".
Distancia(Dados.MED,6)
#7 = Distancia de Mahalanobis.
data(Dados.DBC)
m=MANOVA(Dados.DBC,2)
Med=apply(Dados.DBC[, -c(1:2)],2,function(x) tapply(x,as.factor(Dados.DBC[,1]),mean))
CRE=m$CovarianciaResidual
Distancia(Med,7,CRE)
#8 = Distancia de Cole Rodgers.
Distancia(Dados.MED,8)

######################>Dados qualitativos: binarios ou multicategoricos
#9 = Frequencia de coincidencia.
data(Dados.CAT)
Distancia(Dados.CAT,9)
#10 = Frequencia de discordancia.
Distancia(Dados.CAT,10)
data(Dados.BIN)
Distancia(Dados.BIN,10)
#11 = indice Inverso de 1+coincidencia  > 1/(1+c)
Distancia(Dados.CAT,11)

##############################>Dados qualitativos binarios
data(Dados.BIN)
#12 = Dissimilaridade de Jacard.
Distancia(Dados.BIN,12)
#13 = Dissimilaridade de Sorensen Dice.
Distancia(Dados.BIN,13)
  # 14 = Dissimilaridade de Sokal e Sneath: 1-2(a+d)/(2(a+d)+b+c)
  Distancia(Dados.BIN,14)
  #15 = Dissimilaridade de Roger e Tanimoto: 1-(a+d)/(a+2(b+c)+d)
  Distancia(Dados.BIN,15)
  #16 = Dissimilaridade de Russel e Rao: 1-a/(a+b+c+d).
  Distancia(Dados.BIN,16)
  #17 = Dissimilaridade de Ochiai: 1-a/sqrt((a+b)(a+c)).
  Distancia(Dados.BIN,17)
  #18 = Dissimilaridade de Ochiai II: 1-ab/sqrt((a+b)(a+c)(b+d)(c+d)).
  Distancia(Dados.BIN,18)
  #19 = Dissimilaridade de Haman: 1-((a+d)-(b+c))/(a+b+c+d).
  Distancia(Dados.BIN,19)
  #20 = Dissimilaridade de Yule: 1-(ad-bc)/(ad+bc).
  Distancia(Dados.BIN,20)

#' ##################>Dados mistos (quantitativos, binarios e multicategoricos)
  data(Dados.Misto)
  Distancia(Dados.Misto,21)

[Package MultivariateAnalysis version 0.5.0 Index]