Variable aleatoria multidimensional

11
Covarianza y Transformaciones Bidimensionales Noboa Sebastián, Suquillo Alex Departamento de Eléctrica y Electrónica, Universidad de las Fuerzas Armadas ESPE [email protected] [email protected] Abstract- This document contains the generation, rendering and graphical representation of the CDF and PDF v. to. dimensional as well as obtaining the covariance and correlation coefficient based on real data, presenting the results in scatter diagrams and 3D graphics to the associated pdf and cdf. Besides obtaining some cases for certain pdf dimensional transformations given presents. Resumen-Este documento contiene la generación, representación y representación gráfica de las cdf y pdf de v. a. bidimensionales, así como la obtención de la covarianza y el coeficiente de correlación a partir de datos reales, presentando los resultados en diagramas de dispersan y las gráficas 3D para las pdf y cdf asociadas. Además se presenta la obtención de algunos casos transformaciones bidimensionales para ciertas pdf dadas. I. INTRODUCCIÓN En muchos casos es necesario asociar a cada resultado de un experimento aleatorio, dos o más características numéricas. Por ejemplo, de los remaches que salen de una línea de producción nos puede interesar el diámetro X y la longitud Y. Teniendo en cuenta la inevitable variabilidad en las dimensiones de los remaches debido a las numerosas causas presentes en el proceso de fabricación, los podemos representar asociándoles dos variables aleatorias X e Y que pueden pensarse como una variable aleatoria bidimensional: (X, Y). La covarianza es una medida del grado en que dos variables aleatorias se mueven en la misma dirección o en direcciones opuestas la una respecto a la otra. En otras palabras, si dos variables aleatorias generalmente se mueven en la misma dirección se dirá que tienen una covarianza positiva. Si tienden a moverse en direcciones opuestas, se dirá que tienen una covarianza negativa. La covarianza se mide como el valor que se espera de los productos de las desviaciones de dos variables aleatorias respecto a sus correspondientes medias. Una varianza es un caso especial de covarianza. Un coeficiente de correlación mide el grado en que dos variables tienden a cambiar al mismo tiempo. El coeficiente describe tanto la fuerza como la dirección de la relación. II. MARCO TEORICO A. Distribución conjunta de las v. a. discretas. Sean y es la función (, ) que expresa la probabilidad simultanea de que X tome el valor de e tome el valor de . (, ) = ( = , = ) B. Distribución conjunta de v.a continuas. Sean y v. a. continuas su cdf conjunta es la función de dos variables reales dadas por: (, ) = ( ≤ , ≤ ) Con sus funciones marginales dadas por: () = lim →∞ (, ) () = lim →∞ (, ) C. Densidad conjunta Una cdf conjunta posee una pdf conjunta, si existe una función (, ) de dos variables reales tal que: (, ) = ∫ (, ) −∞ Con sus densidades marginales: () = ∫ (, ) −∞ ; () = ∫ (, ) −∞ D. Covarianza La covarianza de dos v. a. e de define como: (, ) = [( − [])( − [])] (, ) = [] − [][]

description

En este documento se describe la variables aleatorias multidimensionales con la ayuda de MatLab

Transcript of Variable aleatoria multidimensional

Page 1: Variable aleatoria multidimensional

Covarianza y Transformaciones Bidimensionales

Noboa Sebastián, Suquillo Alex

Departamento de Eléctrica y Electrónica, Universidad de las Fuerzas Armadas – ESPE

[email protected]

[email protected]

Abstract- This document contains the generation, rendering and

graphical representation of the CDF and PDF v. to. dimensional as well

as obtaining the covariance and correlation coefficient based on real

data, presenting the results in scatter diagrams and 3D graphics to the

associated pdf and cdf. Besides obtaining some cases for certain pdf

dimensional transformations given presents.

Resumen-Este documento contiene la generación, representación y

representación gráfica de las cdf y pdf de v. a. bidimensionales, así

como la obtención de la covarianza y el coeficiente de correlación a

partir de datos reales, presentando los resultados en diagramas de

dispersan y las gráficas 3D para las pdf y cdf asociadas. Además se

presenta la obtención de algunos casos transformaciones

bidimensionales para ciertas pdf dadas.

I. INTRODUCCIÓN

En muchos casos es necesario asociar a cada resultado de un

experimento aleatorio, dos o más características numéricas. Por

ejemplo, de los remaches que salen de una línea de producción

nos puede interesar el diámetro X y la longitud Y. Teniendo en

cuenta la inevitable variabilidad en las dimensiones de los

remaches debido a las numerosas causas presentes en el proceso

de fabricación, los podemos representar asociándoles dos

variables aleatorias X e Y que pueden pensarse como una

variable aleatoria bidimensional: (X, Y).

La covarianza es una medida del grado en que dos variables

aleatorias se mueven en la misma dirección o en direcciones

opuestas la una respecto a la otra. En otras palabras, si dos

variables aleatorias generalmente se mueven en la misma

dirección se dirá que tienen una covarianza positiva. Si tienden

a moverse en direcciones opuestas, se dirá que tienen una

covarianza negativa. La covarianza se mide como el valor que

se espera de los productos de las desviaciones de dos variables

aleatorias respecto a sus correspondientes medias. Una varianza

es un caso especial de covarianza.

Un coeficiente de correlación mide el grado en que dos

variables tienden a cambiar al mismo tiempo. El coeficiente

describe tanto la fuerza como la dirección de la relación.

II. MARCO TEORICO

A. Distribución conjunta de las v. a. discretas.

Sean 𝑋 y 𝑌 es la función 𝑝(𝑥, 𝑦) que expresa la probabilidad

simultanea de que X tome el valor de 𝑥 e 𝑌 tome el valor de 𝑦.

𝑝(𝑥, 𝑦) = 𝑃(𝑋 = 𝑥, 𝑌 = 𝑦)

B. Distribución conjunta de v.a continuas.

Sean 𝑋 y 𝑌 v. a. continuas su cdf conjunta es la función 𝐹𝑋𝑌 de dos

variables reales dadas por:

𝐹𝑋𝑌(𝑥, 𝑦) = 𝑃(𝑋 ≤ 𝑥, 𝑌 ≤ 𝑦)

Con sus funciones marginales dadas por:

𝐹𝑋(𝑥) = lim𝑦→∞

𝐹𝑋𝑌(𝑥, 𝑦)

𝐹𝑌(𝑦) = lim𝑥→∞

𝐹𝑋𝑌(𝑥, 𝑦)

C. Densidad conjunta

Una cdf conjunta 𝐹𝑋𝑌 posee una pdf conjunta, si existe una función

𝑓𝑋𝑌(𝑥, 𝑦) de dos variables reales tal que:

𝐹𝑋𝑌(𝑥, 𝑦) = ∫ ∫ 𝑓𝑋𝑌(𝑢, 𝑣)𝑑𝑢𝑑𝑣𝑦

𝑥

−∞

Con sus densidades marginales:

𝑓𝑋(𝑥) = ∫ 𝑓𝑋𝑌(𝑥, 𝑦)𝑑𝑦∞

−∞

; 𝑓𝑌(𝑦) = ∫ 𝑓𝑋𝑌(𝑥, 𝑦)𝑑𝑥∞

−∞

D. Covarianza

La covarianza de dos v. a. 𝑋 e 𝑌 de define como:

𝐶𝑜𝑣(𝑋, 𝑌) = 𝐸[(𝑋 − 𝐸[𝑥])(𝑌 − 𝐸[𝑌])]

𝑪𝒐𝒗(𝑿, 𝒀) = 𝑬[𝑿𝒀] − 𝑬[𝑿]𝑬[𝒀]

Page 2: Variable aleatoria multidimensional

E. Coeficiente de correlación

𝜌𝑋𝑌 =𝐶𝑜𝑣(𝑋, 𝑌)

√𝑉𝑎𝑟[𝑋]𝑉𝑎𝑟[𝑌]

F. Transformaciones Bidimensionales

Dadas dos v. a. X e Y y la función 𝑔(𝑥, 𝑦) se desea obtener la cdf y

la pdf de 𝑍 = 𝑔(𝑋, 𝑌), es decir:

𝐹𝑍(𝑧) = 𝑃(𝑍 ≤ 𝑧) = 𝑃((𝑥, 𝑦) ∈ 𝑆𝑍)

𝐹𝑍(𝑧) = ∬ 𝑓𝑋𝑌(𝑥, 𝑦)𝑑𝑥𝑑𝑦𝑆𝑍

Se analizan los siguientes casos de transformaciones:

Caso 1: 𝑍 = 𝑋 + 𝑌

Caso 2: 𝑍 = 𝑋 ∗ 𝑌

Caso 3: 𝑍 = 𝑋/𝑌

III. DESARROLLO

A. Covarianza-correlación

Tomar el peso y la estatura de varias personas. Luego, usando

Matlab graficar datos. ¿Existe alguna relación entre estas dos

variables?

Se tomaron datos de peso y estatura de los y las estudiantes del

curso de procesos estocásticos:

Tabla 1. Datos peso y estatura

Peso Estatura Peso Estatura

60 171 55 155

62 172 75 171

50 151 72 169

64 160 60 170

62 169 60 165

71 179 70 162

65 169 66 165

Se trabajó con una función normal multidimensional de dimensión

𝑑 que viene dada por:

𝑓𝑋(𝑥, 𝜇, Σ) =1

(2𝜋)𝑑/2|Σ|−1exp (−

1

2(𝑥 − 𝜇)′Σ−1(𝑥 − 𝜇))

Donde 𝑥 es un vector de dimensión 𝑑, 𝜇 es el vector de medias, de

dimensión 𝑑, y Σ es la matriz de covarianza, de dimensión 𝑑 × 𝑑 que

es simétrica.

Suponiendo que las v. a X e Y no son independientes, con

coeficientes de correlación 𝜌 ≠ 0 entonces

Σ = (𝜎𝑋

2 𝜌𝜎𝑋𝜎𝑌

𝜌𝜎𝑋𝜎𝑌 𝜎𝑌2 )

Para la implementación en Matlab se ingresan los datos de peso y

estatura en dos vectores, se obtiene la matriz de covarianza de las v. a.

Peso y Estatura, también se obtiene la media de cada v. a y se las guarda

en un vector. Estos parámetros son enviados a la función “csvalnorm”

en la cual se calcula la función de distribución normal (pdf).

Finalmente se grafica los resultados de las variables aleatorias

bidimensionales peso y estatura.

Programa principal :

%distribucion normal multidimensional clc clear P=[60,62,50,64,62,71,65,55,75,72,60,60,70,

66]; E=[171,172,151,160,169,179,169,155,171,169

,170,165,162,165]; mu=[mean(P),mean(E)]; cov_mat=cov(P,E); [x,y]=meshgrid(40:0.5:80,140:0.5:180); X=[x(:),y(:)]; Z=csvalnorm(X,mu,cov_mat); z=reshape(Z,size(x)); subplot(2,1,1),surf(x,y,z); subplot(2,1,2),pcolor(x,y,z),

Función de distribución normal multidimensional

function prob = csvalnorm(x,mu,cov_mat) [n,d]=size(x); x=x-ones(n,1)*mu; a=(2*pi)^(d/2)*sqrt(det(cov_mat)); arg=diag(x*inv(cov_mat)*x'); prob=exp((-.5*arg)); prob=prob/a; end

Resultados:

Fig. Representación gráfica distribución normal multidimensional

Page 3: Variable aleatoria multidimensional

En el grafico superior se tiene la distribución normal

multidimensional para las v.a Peso y Estatura representada en el

espacio formando una especie de cúpula característica para una pdf

normal, en este caso es evidente que la mayor probabilidad está

determinada por la altura de la cúpula y el color más cálido.

Para el grafico inferior se tiene una representación de las v.a Peso y

Estatura en el plano con la misma distribución normal, como se puede

observar la mayor probabilidad está representada por el color más

cálido, por ende con los datos obtenidos existe una gran probabilidad

que las personas pesen entre 64 y 65 kg y midan entre 165 y 170 cm.

Respondiendo a la pregunta de que si existe relación entre las

variables Peso y Estatura, evidentemente existe cierto grado de

relación entre estas variables en la gráfica del plano se puede observar

que la dispersión de los datos tienen una pendiente representando a la

correlación mutua existente:

Fig. Matriz de covarianza

Usando Matlab, calcular la covarianza y el coeciente de

correlación de las variables de la base de datos Implicit tax rate on

energy, de la dirección web:

http://epp.eurostat.ec.europa.eu/tgm/table.do?tab=table&

init=1&language=en&pcode=tsdcc360&plugin=1.

%Belgium- Bulgaria Belgium = [119.57 119.24 122.8 121.39

121.57... 116.75 113.95 118.95 119.72 129.17

135.18... 130.32 135.57 122.9 133.63 129.85

138.21... 140.32 127.74]; Bulgaria = [31.62 16.28 21.06 37.98 47.14

56.57... 57.03 52.36 65.38 76.2 72.82 75.71 97.71

109.62... 111.19 104.8 101.51 99.48 111.06]; figure(1) subplot(2,2,[1,2]); scatter(Belgium, Bulgaria); title('Belgium- Bulgaria') subplot(2,2,3), hist(Belgium); title('Histograma-Belgium') h = findobj(gca,'Type','patch');

set(h,'FaceColor','r') subplot(2,2,4), hist(Bulgaria); title('Histograma-Bulgaria') g = findobj(gca,'Type','patch'); set(g,'FaceColor','b') covarianza = cov(Belgium,Bulgaria) Correlacion = corrcoef(Belgium,Bulgaria)

Fig. Diagrama de dispersión e histograma (Belgium-Bulgaria)

Covarianza y Correlación:

Fig. Matriz de covarianza y c. de correlación (Belgium-Bulg)

%Malta- Poland Malta =[77.75 88.7 97.15 163.51 171.98... 156.82 189.01 193.13 167.96 146.52

182.58... 191.72 270.77 182.03 198.43 188.23

210.52... 204.9 194.6 ]; Poland=[37.48 42.11 42.89 55.64 72.46

76.79... 77.05 89.51 95.04 102.37 108.13 108.71

120.24... 117.4 117.74 115.52 121.2 123.66 125.82 ]; figure(3)

Page 4: Variable aleatoria multidimensional

subplot(2,2,[1,2]); scatter(Malta, Poland); title('Malta-Poland') subplot(2,2,3), hist(Malta); title('Malta') h2 = findobj(gca,'Type','patch'); set(h2,'FaceColor','r') subplot(2,2,4), hist(Poland); title('Poland') g2 = findobj(gca,'Type','patch'); set(g2,'FaceColor','b') covarianza = cov(Malta,Poland) correlacion = corrcoef(Malta,Poland)

Fig. Dispersión e histograma (Malta-Poland)

Fig. Matriz de covarianza y c. de correlación (Malta-Poland)

%Sweden-Spain Sweden=[161.72 178.93 178.34 187.62

187.28... 187.11 196.95 208.05 216.21 219.75

225.74... 229.43 227.86 231.94 238.51 226.52

225.8...

227.5 230.55 ]; Spain = [187.72 189.19 181.79 193.92

196.4... 180.88 170.6 176.14 170.07 163.05

157.29... 159.51 156.07 155 163.91 162.6 155.13

152.82... 170.22]; figure(3) subplot(2,2,[3,4]); scatter(Sweden, Spain); title('Sweden-Spain') subplot(2,2,1), hist(Sweden); title('Sweden') h3 = findobj(gca,'Type','patch'); set(h3,'FaceColor','r') subplot(2,2,2), hist(Spain); title('Spain') g3 = findobj(gca,'Type','patch'); set(g3,'FaceColor','b') covarianza = cov(Sweden,Spain) correlación = corrcoef(Sweden,Spain)

Fig. Dispersión e histograma (Sweden-Spain)

Fig. Matriz de covarianza y c. de correlación (Sweden-Spain)

%France-Italy France = [200.58 195.71 201.24 201.74...

Page 5: Variable aleatoria multidimensional

204.6 196.94 178.62 197.84 190.73

192.64... 189.2 190.44 188.68 180.1 190.04 191.96... 211.84 207.42 214.26]; Italy = [367.1 356.11 357.11 338.06

335.5... 303.75 303.55 296 289.96 274.71 279.47... 282.62 273.88 254.8 290.43 283.59

318.53... 354.71 363.12]; figure(4) subplot(2,2,[3,4]); scatter(France, Italy); title('France-Italy') subplot(2,2,1 ), hist(France); title('France') h4 = findobj(gca,'Type','patch'); set(h4,'FaceColor','b') subplot(2,2,2), hist(Italy); title('Italy') g4 = findobj(gca,'Type','patch'); set(g4,'FaceColor','r') covarianza = cov(France,Italy) correlacion = corrcoef(France,Italy)

Fig. Dispersión e histograma (France-Italy)

Fig. Matriz de covarianza y c. de correlación (France-Italy)

%Germany- Ireland Germany = [178.23 174.61 175.62 175.78... 203.99 220.7 228.09 236.29 245.94

237.01... 227.78 221.73 224.14 214.95 234.9

211.63... 228.04 214.86 205.93]; Ireland = [157.18 160.28 169.2 172.41... 172.67 159.21 140.75 155.27 152.74

167.2... 163.27 157.48 156.55 153.98 186.64

206.52... 230.12 231.45 228.18]; figure(3) subplot(2,2,[3,4]); scatter(Germany, Ireland); title('Germany-Ireland') subplot(2,2,1), hist(Germany); title('Germany') h2 = findobj(gca,'Type','patch'); set(h2,'FaceColor','r') subplot(2,2,2), hist(Ireland); title('Ireland') g2 = findobj(gca,'Type','patch'); set(g2,'FaceColor','b') covarianza = cov(Germany,Ireland) correlacion = corrcoef(Germany,Ireland)

Fig. Dispersión e histograma (Germany-Ireland)

Page 6: Variable aleatoria multidimensional

Fig. Matriz de covarianza y c. de correlación (Germany.Ireland)

Graficar en Matlab la pdf de la distribución normal 2D con

parámetros 𝝁(𝟎, 𝟎) y 𝜮 la identidad.

mu=zeros(1,2); cov_mat=eye(2,2); [x,y]=meshgrid(-4:0.2:4,-4:0.2:4); X=[x(:),y(:)]; Z=csvalnorm(X,mu,cov_mat); z=reshape(Z,size(x)); subplot(1,2,1), surf(x,y,z); title('PDF Normal 3D'); axis tight; subplot(1,2,2), pcolor(x,y,z); title('PDF Normal 2D'); axis square;

Fig. Pdf normal en 2D

Graficar en Matlab la pdf de la distrubución normal 2D con

parámetros 𝝁 = (𝟐, 𝟓) y 𝜮 = [𝟏 𝟎. 𝟕; 𝟎. 𝟕 𝟏]. Adicionar el gráfico de

la cdf.

mu=[2,5]; cov_mat=[1,0.7;0.7,1]; [x,y]=meshgrid(-2:0.2:6,-1:0.2:9); X=[x(:),y(:)]; Z=csvalnorm(X,mu,cov_mat); z=reshape(Z,size(x)); subplot(1,2,1), surf(x,y,z); title('PDF Normal 3D'); axis tight; subplot(1,2,2), pcolor(x,y,z); title('PDF Normal 2D');

axis square; p=mvncdf(X,mu,cov_mat); figure, surf(x,y,reshape(p,size(x))); title('CDF Normal 3D');

Fig. Pdf 2D y 3D

Fig. Cdf Normal 3D

Generar 1000 números aleatorios en Matlab con los parámetros

anteriores y comparar los gráficos.

mu=[2,5]; cov_mat=[1,0.7;0.7,1]; [x,y]=meshgrid(-2:0.2:6,-1:0.2:9); X=[x(:),y(:)]; Z=csvalnorm(X,mu,cov_mat); z=reshape(Z,size(x)); subplot(1,2,1), surf(x,y,z); title('PDF Normal 3D'); axis tight; subplot(1,2,2), pcolor(x,y,z); title('PDF Normal 2D'); axis square; p=mvncdf(X,mu,cov_mat); figure, surf(x,y,reshape(p,size(x))); title('CDF Normal 3D'); df=2; r=mvtrnd(cov_mat,df,1000);

Page 7: Variable aleatoria multidimensional

figure, plot(r(:,1),r(:,2),'.'); title('Dispersion')

Fig. Dispersión

Como se puede observar si se aumentan mas números aleatorios la

dispersión se concentra, a diferencia de los ejemplos anteriores.

B. Transformaciones bidimensionales

Sean 𝑋 e 𝑌 v.a. independientes uniformes (0,1). Hallar la pdf

de 𝑍 = 𝑋 + 𝑌, 𝑍 = 𝑋 ∗ 𝑌 y 𝑍 = 𝑋/𝑌

Caso: 𝒁 = 𝑿 + 𝒀

En los ejemplos desarrollados en el curso se obtuvo la cdf y la pdf

que están dados por:

𝐹𝑍(𝑧) = ∬ 1𝑑𝑥𝑑𝑦𝑥+𝑦≤𝑧

=𝑧2

2 𝑆𝑖: 0 < 𝑧 < 1

y

𝐹𝑍(𝑧) = ∬ 1𝑑𝑥𝑑𝑦𝑥+𝑦≤𝑧

= 1 −(2 − 𝑧)2

2 𝑆𝑖: 1 < 𝑧 < 2

Entonces la nueva pdf asociada es:

𝑓𝑍(𝑧) = 𝑧 𝑆𝑖: 0 < 𝑧 < 1

y

𝑓𝑍(𝑧) = 2 − 𝑧 𝑆𝑖: 1 < 𝑧 < 2

𝑓𝑍(𝑧) = 0 𝑒𝑛 𝑜𝑡𝑟𝑜𝑠 𝑐𝑎𝑠𝑜𝑠

Para representar estos parámetros en MATLAB se realizó el

siguiente programa:

clc clear close all x=random('unif',0,1,[1,10000]); y=random('unif',0,1,[1,10000]); z=x+y; [h,t]=hist(z,50); aux=sum(h)*(t(2)-t(1)); bar(t,h/aux); pdf_z=pdfz(t); hold on plot(t,pdf_z,'r'); hold off

Mediante el comando “random” se generan las variables aleatorias

X e Y, se realiza la operación 𝑍 = 𝑋 + 𝑌, y se representa el resultado

en un histograma, siendo esta una representación de la pdf de las v. a.

generadas.

Para la pdf obtenida mediante los cálculos matemáticos para la

nueva variable 𝑧 ha sido necesario crear una función llamada “pdfz”,

descrita en el siguiente programa:

function y=pdfz(t); n=max(size(t)); y=zeros(1,n); for i=1:n if t(i)<0 y(i)=0; elseif t(i)>=0 && t(i)<1 y(i)=t(i); elseif t(i)>=1 && t(i)<2 y(i)=2-t(i);

Page 8: Variable aleatoria multidimensional

else y(i)=0; end end

Esta pdf es ideal, las dos representaciones han sido superpuestas

para poder compararlas, como se puede observar en la siguiente figura:

Fig. Pdf caso Z = X+Y (1000 v.a.)

En color rojo se puede observar la pdf ideal determinada mediante

cálculos matemáticos, y los datos aleatorios están representados por el

histograma formando una pdf real que se aproxima a la ideal.

Fig. Pdf caso Z = X+Y (10000 v.a.)

Fig. Pdf caso Z = X+Y (100000 v.a.)

Como se puede observar en las figuras () y () si aumenta el número

de v. a. la pdf real se aproxima mucho más a la pdf ideal

Caso: 𝒁 = 𝑿 ∗ 𝒀

En este caso se obtuvo la siguientes pdf para la variable z:

𝑓𝑍(𝑧) = ∫1

𝑤𝑑𝑤

1

𝑧

= − ln(𝑧) 𝑆𝑖: 0 < 𝑧 < 1

Se utiliza el mismo programa que el caso anterior con algunas

diferencias:

clc clear close all x=random('unif',0,1,[1,100000]); y=random('unif',0,1,[1,100000]); z=x.*y; [h,t]=hist(z,50); aux=sum(h)*(t(2)-t(1)); bar(t,h/aux); pdf_z=pdfz(t); hold on plot(t,pdf_z,'r'); hold off xlabel('z') ylabel('f(z)')

Con el comando “random” se generan las variables aleatorias X e

Y, en este caso se realiza la operación 𝑍 = 𝑋 ∗ 𝑌, y se representa el

resultado en un histograma, siendo esta una representación de la pdf

cercana a la realidad.

Como se vio la pdf cambia por lo tanto la función “pdfz” de

MATLAB también debe ser modificada de la siguiente manera:

function y=pdfz(t); n=max(size(t)); y=zeros(1,n);

Page 9: Variable aleatoria multidimensional

for i=1:n if t(i)<0 y(i)=0; elseif t(i)>=0 && t(i)<1 y(i)=-log(t(i)); else y(i)=0; end end

Superposición de pdf real y pdf ideal, para este caso representado

por −ln (𝑧)

Fig. Pdf caso 𝑍 = 𝑋 ∗ 𝑌 (1000 v.a.)

En color rojo se puede observar la pdf ideal determinada mediante

cálculos matemáticos, y los datos aleatorios están representados por el

histograma formando una pdf real que se aproxima a la ideal.

Fig. Pdf caso 𝑍 = 𝑋 ∗ 𝑌 (100000 v.a.)

Al igual que el caso anterior se puede observar que si se aumenta el

número de variables aleatorias se obtiene una mejor aproximación.

Caso: 𝒁 = 𝑿/𝒀

𝑍 = 𝑋/𝑌, 𝑊 = 𝑌, 𝑌 = 𝑊

⇒ 𝑋 = 𝑍𝑊

𝑓𝑋,𝑌(𝑥, 𝑦) = 𝑓𝑋(𝑥) ∙ 𝑓𝑌(𝑦)

𝑓𝑍,𝑊(𝑧, 𝑤) = |𝐽|𝑓𝑋,𝑌(𝑥, 𝑦)

𝑓𝑍,𝑊(𝑧, 𝑤) = |𝐽|𝑓𝑋,𝑌(𝑧𝑤, 𝑤)

𝑓𝑍,𝑊(𝑧, 𝑤) = |𝐽|𝑓𝑋(𝑧𝑤)𝑓𝑌(𝑤)

|𝐽| = |𝑤|

𝑓𝑍,𝑊(𝑧, 𝑤) = |𝑤|𝑓𝑋(𝑧𝑤)𝑓𝑌(𝑤)

𝑓𝑍(𝑧) = ∫ |𝑤|𝑓𝑋(𝑧𝑤)𝑓𝑌(𝑤)𝑑𝑤

−∞

𝑓𝑍(𝑧) = ∫ 𝑤𝑑𝑤

1

𝑧

𝒇𝒁(𝒛) = 𝟏 −𝒛𝟐

𝟐

Sean 𝑋 e 𝑌 v.a. independientes para N(0,1). Hallar la pdf de

𝑍 = 𝑋 + 𝑌, 𝑍 = 𝑋 ∗ 𝑌 y 𝑍 = 𝑋/𝑌

Caso: 𝒁 = 𝑿 + 𝒀

𝑥 + 𝑦 ≤ 𝑧 ; 𝑦 = 𝑧 − 𝑥

Sean las pdf:

𝑓𝑋(𝑥) =1

√2𝜋exp (−

𝑥2

2) ; 𝑓𝑌(𝑦) =

1

√2𝜋exp (−

𝑦2

2)

𝑓𝑍(𝑧) = ∫ 𝑓𝑋𝑌(𝑥, 𝑧 − 𝑥)𝑑𝑥

−∞

Independientes:

𝑓𝑍(𝑧) = ∫ 𝑓𝑋(𝑥)𝑓𝑌(𝑧 − 𝑥)𝑑𝑥

−∞

𝑓𝑍(𝑧) = ∫1

√2𝜋exp (−

𝑥2

2) ∙

1

√2𝜋exp (−

(𝑧 − 𝑥)2

2) 𝑑𝑥

−∞

Nueva pdf de Z:

𝒇𝒁(𝒛) =𝟏

√𝟐∙

𝟏

√𝟐𝝅𝐞𝐱𝐩 (−

𝒛𝟐

𝟒)

Una vez obtenida la pdf, se implementa el siguiente programa en

MatLab:

clc clear close all x=random('norm',0,1,[1,1000]); y=random('norm',0,1,[1,1000]); z=x+y; [h,t]=hist(z,50);

Page 10: Variable aleatoria multidimensional

aux=sum(h)*(t(2)-t(1)); bar(t,h/aux); pdf_z=pdfz_norm(t); hold on plot(t,pdf_z,'r'); hold off xlabel('z') ylabel('f(z)')

Se genera v. a. para X e Y para una pdf N(0,1), y se sigue el mismo

procedimiento que en caso anterior.

También ha sido necesario crear una función “pdfz_norm” en la

cual se genera la nueva pdf a partir del análisis matemático:

function y=pdfz_norm(t) n=max(size(t)); y=zeros(1,n); for i=1:n y(i)=1/(2*sqrt(pi))*exp(-

t(i)^2/(2*sqrt(2)^2)); end

Los resultados gráficos son presentados a continuación:

Fig. Pdf caso: Z=X+Y (1000 v. a.)

Como se puede observar para una pdf dada por N(0,1) en X e Y, la

transformación Z=X+Y genera una función de distribución pdf que

presenta la misma forma que X e Y, se lo evidencia gráficamente y en

la forma de la función obtenida analíticamente.

En rojo se observa la pdf que se la puede considerar ideal puesto

que tiene una función matemática asociada, mientras que el

histograma representa la distribución de las variables aleatorias

generadas, para el caso de 1000 v. a. e

Fig. Pdf caso: Z=X+Y (100000 v. a.)

Es evidente que cuando se aumenta la cantidad de v. a., el

histograma se aproxima más a la pdf generada a partir de la función

matemática asociada.

Caso: 𝒁 = 𝑿/𝒀

𝑍 = 𝑋/𝑌, 𝑊 = 𝑌, 𝑌 = 𝑊

⇒ 𝑋 = 𝑍𝑊

𝑓𝑋,𝑌(𝑥, 𝑦) = 𝑓𝑋(𝑥) ∙ 𝑓𝑌(𝑦)

𝑓𝑍,𝑊(𝑧, 𝑤) = |𝐽|𝑓𝑋,𝑌(𝑥, 𝑦)

𝑓𝑍,𝑊(𝑧, 𝑤) = |𝐽|𝑓𝑋,𝑌(𝑧𝑤, 𝑤)

𝑓𝑍,𝑊(𝑧, 𝑤) = |𝐽|𝑓𝑋(𝑧𝑤)𝑓𝑌(𝑤)

|𝐽| = |𝑤|

𝑓𝑍,𝑊(𝑧, 𝑤) = |𝑤|𝑓𝑋(𝑧𝑤)𝑓𝑌(𝑤)

𝑓𝑍(𝑧) = ∫ |𝑤|𝑓𝑋(𝑧𝑤)𝑓𝑌(𝑤)𝑑𝑤

−∞

𝑓𝑍(𝑧) = ∫ |𝑤|1

√2𝜋exp (−

(𝑧𝑤)2

2) ∙

1

√2𝜋exp (−

𝑤2

2) 𝑑𝑤

−∞

𝒇𝒁(𝒛) =𝟏

𝝅(𝟏 + 𝒛𝟐) ; 𝑺𝒊 − ∞ < 𝒛 < ∞

Una vez obtenida la pdf, se implementa el siguiente programa en

MatLab:

clc clear close all x=random('norm',0,1,[1,1000]); y=random('norm',0,1,[1,1000]); z=x/y; [h,t]=hist(z,50); aux=sum(h)*(t(2)-t(1)); bar(t,h/aux); pdf_z=pdfz_norm(t);

Page 11: Variable aleatoria multidimensional

hold on plot(t,pdf_z,'r'); hold off xlabel('z') ylabel('f(z)')

Se genera v. a. para X e Y para una pdf N(0,1), y se sigue el mismo

procedimiento que en caso anterior.

También ha sido necesario crear una función “pdfz_norm” en la

cual se genera la nueva pdf a partir del análisis matemático:

function y=pdfz_norm(t) n=max(size(t)); y=zeros(1,n); for i=1:n y(i)=1/(pi*(1+(t(i)).^2)); end

Los resultados gráficos son presentados a continuación:

Fig. Pdf caso: Z=X/Y (100 v. a.)

En rojo se observa la pdf que se la puede considerar ideal puesto

que tiene una función matemática que representa a la pdf, mientras

que el histograma representa la distribución de las variables aleatorias

generadas, para el caso de 100 v. a. e

Fig. Pdf caso: Z=X/Y (1000 v. a.)

Si se aumenta la cantidad de v. a., el histograma se aproxima más a

la pdf generada a partir de la función matemática asociada.

IV. CONCLUSIONES

Es importante el conocimiento y uso de v. a. multidimensionales

debido a que en la naturaleza se puede encontrar diversos fenómenos

que se pueden describir a partir de estas, como se vio en este trabajo la

v. a. estatura es dependiente de v. a. peso, de esta manera se llega a

distintos tipos de conclusiones a través de las funciones de

probabilidad conjuntas y marginales.

Matlab permite obtener los datos de covarianza y el coeficiente de

correlación a partir de datos aleatorios, lo que permite tener una noción

de la dependencia directa que tienen cierto tipo de datos como se vio

en el análisis de la base de datos, el grado de correlación y la covarianza

se lo visualiza numéricamente y a través de las gráficas de dispersión.

Las v. a. generan cdf y pdf conjuntas que se pueden representar

mediante graficas 3D, como se vio Matlab facilita la representación

3D, haciendo posible la correcta interpretación de las funciones de

distribución para el caso de v. a. bidimensionales.

Se pudo obtener las transformaciones bidimensionales para algunos

casos partiendo de números aleatorios sujetos a una pdf se generó una

nueva pdf para una transformación dada, y se comparó con las

funciones distribución (pdf) ideales obtenidas analíticamente, de tal

manera que cuando se aumenta la cantidad de números aleatorios la

distribución de estos tiende a aproximarse a la función de distribución

ideal.

REFERENCIAS

[1] Chapra, S , “Método numéricos para ingenieros”, 5ta edición,

Mc Graw Hill, Mexico, ISBN: 970-10-6114-4

[2] Schaum, Monson. H, Outline of Theory and Problems of Digital Signal

Processing, McGraw Hill, 2nd Ed., 2011.

[3] Diniz. P, Digital Signal Processing: System Analysis and Design,

Cambridge University Press, 2nd Ed., 2010