Variable aleatoria multidimensional
-
Upload
alex-suquillo -
Category
Documents
-
view
33 -
download
2
description
Transcript of Variable aleatoria multidimensional
Covarianza y Transformaciones Bidimensionales
Noboa Sebastián, Suquillo Alex
Departamento de Eléctrica y Electrónica, Universidad de las Fuerzas Armadas – ESPE
Abstract- This document contains the generation, rendering and
graphical representation of the CDF and PDF v. to. dimensional as well
as obtaining the covariance and correlation coefficient based on real
data, presenting the results in scatter diagrams and 3D graphics to the
associated pdf and cdf. Besides obtaining some cases for certain pdf
dimensional transformations given presents.
Resumen-Este documento contiene la generación, representación y
representación gráfica de las cdf y pdf de v. a. bidimensionales, así
como la obtención de la covarianza y el coeficiente de correlación a
partir de datos reales, presentando los resultados en diagramas de
dispersan y las gráficas 3D para las pdf y cdf asociadas. Además se
presenta la obtención de algunos casos transformaciones
bidimensionales para ciertas pdf dadas.
I. INTRODUCCIÓN
En muchos casos es necesario asociar a cada resultado de un
experimento aleatorio, dos o más características numéricas. Por
ejemplo, de los remaches que salen de una línea de producción
nos puede interesar el diámetro X y la longitud Y. Teniendo en
cuenta la inevitable variabilidad en las dimensiones de los
remaches debido a las numerosas causas presentes en el proceso
de fabricación, los podemos representar asociándoles dos
variables aleatorias X e Y que pueden pensarse como una
variable aleatoria bidimensional: (X, Y).
La covarianza es una medida del grado en que dos variables
aleatorias se mueven en la misma dirección o en direcciones
opuestas la una respecto a la otra. En otras palabras, si dos
variables aleatorias generalmente se mueven en la misma
dirección se dirá que tienen una covarianza positiva. Si tienden
a moverse en direcciones opuestas, se dirá que tienen una
covarianza negativa. La covarianza se mide como el valor que
se espera de los productos de las desviaciones de dos variables
aleatorias respecto a sus correspondientes medias. Una varianza
es un caso especial de covarianza.
Un coeficiente de correlación mide el grado en que dos
variables tienden a cambiar al mismo tiempo. El coeficiente
describe tanto la fuerza como la dirección de la relación.
II. MARCO TEORICO
A. Distribución conjunta de las v. a. discretas.
Sean 𝑋 y 𝑌 es la función 𝑝(𝑥, 𝑦) que expresa la probabilidad
simultanea de que X tome el valor de 𝑥 e 𝑌 tome el valor de 𝑦.
𝑝(𝑥, 𝑦) = 𝑃(𝑋 = 𝑥, 𝑌 = 𝑦)
B. Distribución conjunta de v.a continuas.
Sean 𝑋 y 𝑌 v. a. continuas su cdf conjunta es la función 𝐹𝑋𝑌 de dos
variables reales dadas por:
𝐹𝑋𝑌(𝑥, 𝑦) = 𝑃(𝑋 ≤ 𝑥, 𝑌 ≤ 𝑦)
Con sus funciones marginales dadas por:
𝐹𝑋(𝑥) = lim𝑦→∞
𝐹𝑋𝑌(𝑥, 𝑦)
𝐹𝑌(𝑦) = lim𝑥→∞
𝐹𝑋𝑌(𝑥, 𝑦)
C. Densidad conjunta
Una cdf conjunta 𝐹𝑋𝑌 posee una pdf conjunta, si existe una función
𝑓𝑋𝑌(𝑥, 𝑦) de dos variables reales tal que:
𝐹𝑋𝑌(𝑥, 𝑦) = ∫ ∫ 𝑓𝑋𝑌(𝑢, 𝑣)𝑑𝑢𝑑𝑣𝑦
∞
𝑥
−∞
Con sus densidades marginales:
𝑓𝑋(𝑥) = ∫ 𝑓𝑋𝑌(𝑥, 𝑦)𝑑𝑦∞
−∞
; 𝑓𝑌(𝑦) = ∫ 𝑓𝑋𝑌(𝑥, 𝑦)𝑑𝑥∞
−∞
D. Covarianza
La covarianza de dos v. a. 𝑋 e 𝑌 de define como:
𝐶𝑜𝑣(𝑋, 𝑌) = 𝐸[(𝑋 − 𝐸[𝑥])(𝑌 − 𝐸[𝑌])]
𝑪𝒐𝒗(𝑿, 𝒀) = 𝑬[𝑿𝒀] − 𝑬[𝑿]𝑬[𝒀]
E. Coeficiente de correlación
𝜌𝑋𝑌 =𝐶𝑜𝑣(𝑋, 𝑌)
√𝑉𝑎𝑟[𝑋]𝑉𝑎𝑟[𝑌]
F. Transformaciones Bidimensionales
Dadas dos v. a. X e Y y la función 𝑔(𝑥, 𝑦) se desea obtener la cdf y
la pdf de 𝑍 = 𝑔(𝑋, 𝑌), es decir:
𝐹𝑍(𝑧) = 𝑃(𝑍 ≤ 𝑧) = 𝑃((𝑥, 𝑦) ∈ 𝑆𝑍)
𝐹𝑍(𝑧) = ∬ 𝑓𝑋𝑌(𝑥, 𝑦)𝑑𝑥𝑑𝑦𝑆𝑍
Se analizan los siguientes casos de transformaciones:
Caso 1: 𝑍 = 𝑋 + 𝑌
Caso 2: 𝑍 = 𝑋 ∗ 𝑌
Caso 3: 𝑍 = 𝑋/𝑌
III. DESARROLLO
A. Covarianza-correlación
Tomar el peso y la estatura de varias personas. Luego, usando
Matlab graficar datos. ¿Existe alguna relación entre estas dos
variables?
Se tomaron datos de peso y estatura de los y las estudiantes del
curso de procesos estocásticos:
Tabla 1. Datos peso y estatura
Peso Estatura Peso Estatura
60 171 55 155
62 172 75 171
50 151 72 169
64 160 60 170
62 169 60 165
71 179 70 162
65 169 66 165
Se trabajó con una función normal multidimensional de dimensión
𝑑 que viene dada por:
𝑓𝑋(𝑥, 𝜇, Σ) =1
(2𝜋)𝑑/2|Σ|−1exp (−
1
2(𝑥 − 𝜇)′Σ−1(𝑥 − 𝜇))
Donde 𝑥 es un vector de dimensión 𝑑, 𝜇 es el vector de medias, de
dimensión 𝑑, y Σ es la matriz de covarianza, de dimensión 𝑑 × 𝑑 que
es simétrica.
Suponiendo que las v. a X e Y no son independientes, con
coeficientes de correlación 𝜌 ≠ 0 entonces
Σ = (𝜎𝑋
2 𝜌𝜎𝑋𝜎𝑌
𝜌𝜎𝑋𝜎𝑌 𝜎𝑌2 )
Para la implementación en Matlab se ingresan los datos de peso y
estatura en dos vectores, se obtiene la matriz de covarianza de las v. a.
Peso y Estatura, también se obtiene la media de cada v. a y se las guarda
en un vector. Estos parámetros son enviados a la función “csvalnorm”
en la cual se calcula la función de distribución normal (pdf).
Finalmente se grafica los resultados de las variables aleatorias
bidimensionales peso y estatura.
Programa principal :
%distribucion normal multidimensional clc clear P=[60,62,50,64,62,71,65,55,75,72,60,60,70,
66]; E=[171,172,151,160,169,179,169,155,171,169
,170,165,162,165]; mu=[mean(P),mean(E)]; cov_mat=cov(P,E); [x,y]=meshgrid(40:0.5:80,140:0.5:180); X=[x(:),y(:)]; Z=csvalnorm(X,mu,cov_mat); z=reshape(Z,size(x)); subplot(2,1,1),surf(x,y,z); subplot(2,1,2),pcolor(x,y,z),
Función de distribución normal multidimensional
function prob = csvalnorm(x,mu,cov_mat) [n,d]=size(x); x=x-ones(n,1)*mu; a=(2*pi)^(d/2)*sqrt(det(cov_mat)); arg=diag(x*inv(cov_mat)*x'); prob=exp((-.5*arg)); prob=prob/a; end
Resultados:
Fig. Representación gráfica distribución normal multidimensional
En el grafico superior se tiene la distribución normal
multidimensional para las v.a Peso y Estatura representada en el
espacio formando una especie de cúpula característica para una pdf
normal, en este caso es evidente que la mayor probabilidad está
determinada por la altura de la cúpula y el color más cálido.
Para el grafico inferior se tiene una representación de las v.a Peso y
Estatura en el plano con la misma distribución normal, como se puede
observar la mayor probabilidad está representada por el color más
cálido, por ende con los datos obtenidos existe una gran probabilidad
que las personas pesen entre 64 y 65 kg y midan entre 165 y 170 cm.
Respondiendo a la pregunta de que si existe relación entre las
variables Peso y Estatura, evidentemente existe cierto grado de
relación entre estas variables en la gráfica del plano se puede observar
que la dispersión de los datos tienen una pendiente representando a la
correlación mutua existente:
Fig. Matriz de covarianza
Usando Matlab, calcular la covarianza y el coeciente de
correlación de las variables de la base de datos Implicit tax rate on
energy, de la dirección web:
http://epp.eurostat.ec.europa.eu/tgm/table.do?tab=table&
init=1&language=en&pcode=tsdcc360&plugin=1.
%Belgium- Bulgaria Belgium = [119.57 119.24 122.8 121.39
121.57... 116.75 113.95 118.95 119.72 129.17
135.18... 130.32 135.57 122.9 133.63 129.85
138.21... 140.32 127.74]; Bulgaria = [31.62 16.28 21.06 37.98 47.14
56.57... 57.03 52.36 65.38 76.2 72.82 75.71 97.71
109.62... 111.19 104.8 101.51 99.48 111.06]; figure(1) subplot(2,2,[1,2]); scatter(Belgium, Bulgaria); title('Belgium- Bulgaria') subplot(2,2,3), hist(Belgium); title('Histograma-Belgium') h = findobj(gca,'Type','patch');
set(h,'FaceColor','r') subplot(2,2,4), hist(Bulgaria); title('Histograma-Bulgaria') g = findobj(gca,'Type','patch'); set(g,'FaceColor','b') covarianza = cov(Belgium,Bulgaria) Correlacion = corrcoef(Belgium,Bulgaria)
Fig. Diagrama de dispersión e histograma (Belgium-Bulgaria)
Covarianza y Correlación:
Fig. Matriz de covarianza y c. de correlación (Belgium-Bulg)
%Malta- Poland Malta =[77.75 88.7 97.15 163.51 171.98... 156.82 189.01 193.13 167.96 146.52
182.58... 191.72 270.77 182.03 198.43 188.23
210.52... 204.9 194.6 ]; Poland=[37.48 42.11 42.89 55.64 72.46
76.79... 77.05 89.51 95.04 102.37 108.13 108.71
120.24... 117.4 117.74 115.52 121.2 123.66 125.82 ]; figure(3)
subplot(2,2,[1,2]); scatter(Malta, Poland); title('Malta-Poland') subplot(2,2,3), hist(Malta); title('Malta') h2 = findobj(gca,'Type','patch'); set(h2,'FaceColor','r') subplot(2,2,4), hist(Poland); title('Poland') g2 = findobj(gca,'Type','patch'); set(g2,'FaceColor','b') covarianza = cov(Malta,Poland) correlacion = corrcoef(Malta,Poland)
Fig. Dispersión e histograma (Malta-Poland)
Fig. Matriz de covarianza y c. de correlación (Malta-Poland)
%Sweden-Spain Sweden=[161.72 178.93 178.34 187.62
187.28... 187.11 196.95 208.05 216.21 219.75
225.74... 229.43 227.86 231.94 238.51 226.52
225.8...
227.5 230.55 ]; Spain = [187.72 189.19 181.79 193.92
196.4... 180.88 170.6 176.14 170.07 163.05
157.29... 159.51 156.07 155 163.91 162.6 155.13
152.82... 170.22]; figure(3) subplot(2,2,[3,4]); scatter(Sweden, Spain); title('Sweden-Spain') subplot(2,2,1), hist(Sweden); title('Sweden') h3 = findobj(gca,'Type','patch'); set(h3,'FaceColor','r') subplot(2,2,2), hist(Spain); title('Spain') g3 = findobj(gca,'Type','patch'); set(g3,'FaceColor','b') covarianza = cov(Sweden,Spain) correlación = corrcoef(Sweden,Spain)
Fig. Dispersión e histograma (Sweden-Spain)
Fig. Matriz de covarianza y c. de correlación (Sweden-Spain)
%France-Italy France = [200.58 195.71 201.24 201.74...
204.6 196.94 178.62 197.84 190.73
192.64... 189.2 190.44 188.68 180.1 190.04 191.96... 211.84 207.42 214.26]; Italy = [367.1 356.11 357.11 338.06
335.5... 303.75 303.55 296 289.96 274.71 279.47... 282.62 273.88 254.8 290.43 283.59
318.53... 354.71 363.12]; figure(4) subplot(2,2,[3,4]); scatter(France, Italy); title('France-Italy') subplot(2,2,1 ), hist(France); title('France') h4 = findobj(gca,'Type','patch'); set(h4,'FaceColor','b') subplot(2,2,2), hist(Italy); title('Italy') g4 = findobj(gca,'Type','patch'); set(g4,'FaceColor','r') covarianza = cov(France,Italy) correlacion = corrcoef(France,Italy)
Fig. Dispersión e histograma (France-Italy)
Fig. Matriz de covarianza y c. de correlación (France-Italy)
%Germany- Ireland Germany = [178.23 174.61 175.62 175.78... 203.99 220.7 228.09 236.29 245.94
237.01... 227.78 221.73 224.14 214.95 234.9
211.63... 228.04 214.86 205.93]; Ireland = [157.18 160.28 169.2 172.41... 172.67 159.21 140.75 155.27 152.74
167.2... 163.27 157.48 156.55 153.98 186.64
206.52... 230.12 231.45 228.18]; figure(3) subplot(2,2,[3,4]); scatter(Germany, Ireland); title('Germany-Ireland') subplot(2,2,1), hist(Germany); title('Germany') h2 = findobj(gca,'Type','patch'); set(h2,'FaceColor','r') subplot(2,2,2), hist(Ireland); title('Ireland') g2 = findobj(gca,'Type','patch'); set(g2,'FaceColor','b') covarianza = cov(Germany,Ireland) correlacion = corrcoef(Germany,Ireland)
Fig. Dispersión e histograma (Germany-Ireland)
Fig. Matriz de covarianza y c. de correlación (Germany.Ireland)
Graficar en Matlab la pdf de la distribución normal 2D con
parámetros 𝝁(𝟎, 𝟎) y 𝜮 la identidad.
mu=zeros(1,2); cov_mat=eye(2,2); [x,y]=meshgrid(-4:0.2:4,-4:0.2:4); X=[x(:),y(:)]; Z=csvalnorm(X,mu,cov_mat); z=reshape(Z,size(x)); subplot(1,2,1), surf(x,y,z); title('PDF Normal 3D'); axis tight; subplot(1,2,2), pcolor(x,y,z); title('PDF Normal 2D'); axis square;
Fig. Pdf normal en 2D
Graficar en Matlab la pdf de la distrubución normal 2D con
parámetros 𝝁 = (𝟐, 𝟓) y 𝜮 = [𝟏 𝟎. 𝟕; 𝟎. 𝟕 𝟏]. Adicionar el gráfico de
la cdf.
mu=[2,5]; cov_mat=[1,0.7;0.7,1]; [x,y]=meshgrid(-2:0.2:6,-1:0.2:9); X=[x(:),y(:)]; Z=csvalnorm(X,mu,cov_mat); z=reshape(Z,size(x)); subplot(1,2,1), surf(x,y,z); title('PDF Normal 3D'); axis tight; subplot(1,2,2), pcolor(x,y,z); title('PDF Normal 2D');
axis square; p=mvncdf(X,mu,cov_mat); figure, surf(x,y,reshape(p,size(x))); title('CDF Normal 3D');
Fig. Pdf 2D y 3D
Fig. Cdf Normal 3D
Generar 1000 números aleatorios en Matlab con los parámetros
anteriores y comparar los gráficos.
mu=[2,5]; cov_mat=[1,0.7;0.7,1]; [x,y]=meshgrid(-2:0.2:6,-1:0.2:9); X=[x(:),y(:)]; Z=csvalnorm(X,mu,cov_mat); z=reshape(Z,size(x)); subplot(1,2,1), surf(x,y,z); title('PDF Normal 3D'); axis tight; subplot(1,2,2), pcolor(x,y,z); title('PDF Normal 2D'); axis square; p=mvncdf(X,mu,cov_mat); figure, surf(x,y,reshape(p,size(x))); title('CDF Normal 3D'); df=2; r=mvtrnd(cov_mat,df,1000);
figure, plot(r(:,1),r(:,2),'.'); title('Dispersion')
Fig. Dispersión
Como se puede observar si se aumentan mas números aleatorios la
dispersión se concentra, a diferencia de los ejemplos anteriores.
B. Transformaciones bidimensionales
Sean 𝑋 e 𝑌 v.a. independientes uniformes (0,1). Hallar la pdf
de 𝑍 = 𝑋 + 𝑌, 𝑍 = 𝑋 ∗ 𝑌 y 𝑍 = 𝑋/𝑌
Caso: 𝒁 = 𝑿 + 𝒀
En los ejemplos desarrollados en el curso se obtuvo la cdf y la pdf
que están dados por:
𝐹𝑍(𝑧) = ∬ 1𝑑𝑥𝑑𝑦𝑥+𝑦≤𝑧
=𝑧2
2 𝑆𝑖: 0 < 𝑧 < 1
y
𝐹𝑍(𝑧) = ∬ 1𝑑𝑥𝑑𝑦𝑥+𝑦≤𝑧
= 1 −(2 − 𝑧)2
2 𝑆𝑖: 1 < 𝑧 < 2
Entonces la nueva pdf asociada es:
𝑓𝑍(𝑧) = 𝑧 𝑆𝑖: 0 < 𝑧 < 1
y
𝑓𝑍(𝑧) = 2 − 𝑧 𝑆𝑖: 1 < 𝑧 < 2
𝑓𝑍(𝑧) = 0 𝑒𝑛 𝑜𝑡𝑟𝑜𝑠 𝑐𝑎𝑠𝑜𝑠
Para representar estos parámetros en MATLAB se realizó el
siguiente programa:
clc clear close all x=random('unif',0,1,[1,10000]); y=random('unif',0,1,[1,10000]); z=x+y; [h,t]=hist(z,50); aux=sum(h)*(t(2)-t(1)); bar(t,h/aux); pdf_z=pdfz(t); hold on plot(t,pdf_z,'r'); hold off
Mediante el comando “random” se generan las variables aleatorias
X e Y, se realiza la operación 𝑍 = 𝑋 + 𝑌, y se representa el resultado
en un histograma, siendo esta una representación de la pdf de las v. a.
generadas.
Para la pdf obtenida mediante los cálculos matemáticos para la
nueva variable 𝑧 ha sido necesario crear una función llamada “pdfz”,
descrita en el siguiente programa:
function y=pdfz(t); n=max(size(t)); y=zeros(1,n); for i=1:n if t(i)<0 y(i)=0; elseif t(i)>=0 && t(i)<1 y(i)=t(i); elseif t(i)>=1 && t(i)<2 y(i)=2-t(i);
else y(i)=0; end end
Esta pdf es ideal, las dos representaciones han sido superpuestas
para poder compararlas, como se puede observar en la siguiente figura:
Fig. Pdf caso Z = X+Y (1000 v.a.)
En color rojo se puede observar la pdf ideal determinada mediante
cálculos matemáticos, y los datos aleatorios están representados por el
histograma formando una pdf real que se aproxima a la ideal.
Fig. Pdf caso Z = X+Y (10000 v.a.)
Fig. Pdf caso Z = X+Y (100000 v.a.)
Como se puede observar en las figuras () y () si aumenta el número
de v. a. la pdf real se aproxima mucho más a la pdf ideal
Caso: 𝒁 = 𝑿 ∗ 𝒀
En este caso se obtuvo la siguientes pdf para la variable z:
𝑓𝑍(𝑧) = ∫1
𝑤𝑑𝑤
1
𝑧
= − ln(𝑧) 𝑆𝑖: 0 < 𝑧 < 1
Se utiliza el mismo programa que el caso anterior con algunas
diferencias:
clc clear close all x=random('unif',0,1,[1,100000]); y=random('unif',0,1,[1,100000]); z=x.*y; [h,t]=hist(z,50); aux=sum(h)*(t(2)-t(1)); bar(t,h/aux); pdf_z=pdfz(t); hold on plot(t,pdf_z,'r'); hold off xlabel('z') ylabel('f(z)')
Con el comando “random” se generan las variables aleatorias X e
Y, en este caso se realiza la operación 𝑍 = 𝑋 ∗ 𝑌, y se representa el
resultado en un histograma, siendo esta una representación de la pdf
cercana a la realidad.
Como se vio la pdf cambia por lo tanto la función “pdfz” de
MATLAB también debe ser modificada de la siguiente manera:
function y=pdfz(t); n=max(size(t)); y=zeros(1,n);
for i=1:n if t(i)<0 y(i)=0; elseif t(i)>=0 && t(i)<1 y(i)=-log(t(i)); else y(i)=0; end end
Superposición de pdf real y pdf ideal, para este caso representado
por −ln (𝑧)
Fig. Pdf caso 𝑍 = 𝑋 ∗ 𝑌 (1000 v.a.)
En color rojo se puede observar la pdf ideal determinada mediante
cálculos matemáticos, y los datos aleatorios están representados por el
histograma formando una pdf real que se aproxima a la ideal.
Fig. Pdf caso 𝑍 = 𝑋 ∗ 𝑌 (100000 v.a.)
Al igual que el caso anterior se puede observar que si se aumenta el
número de variables aleatorias se obtiene una mejor aproximación.
Caso: 𝒁 = 𝑿/𝒀
𝑍 = 𝑋/𝑌, 𝑊 = 𝑌, 𝑌 = 𝑊
⇒ 𝑋 = 𝑍𝑊
𝑓𝑋,𝑌(𝑥, 𝑦) = 𝑓𝑋(𝑥) ∙ 𝑓𝑌(𝑦)
𝑓𝑍,𝑊(𝑧, 𝑤) = |𝐽|𝑓𝑋,𝑌(𝑥, 𝑦)
𝑓𝑍,𝑊(𝑧, 𝑤) = |𝐽|𝑓𝑋,𝑌(𝑧𝑤, 𝑤)
𝑓𝑍,𝑊(𝑧, 𝑤) = |𝐽|𝑓𝑋(𝑧𝑤)𝑓𝑌(𝑤)
|𝐽| = |𝑤|
𝑓𝑍,𝑊(𝑧, 𝑤) = |𝑤|𝑓𝑋(𝑧𝑤)𝑓𝑌(𝑤)
𝑓𝑍(𝑧) = ∫ |𝑤|𝑓𝑋(𝑧𝑤)𝑓𝑌(𝑤)𝑑𝑤
∞
−∞
𝑓𝑍(𝑧) = ∫ 𝑤𝑑𝑤
1
𝑧
𝒇𝒁(𝒛) = 𝟏 −𝒛𝟐
𝟐
Sean 𝑋 e 𝑌 v.a. independientes para N(0,1). Hallar la pdf de
𝑍 = 𝑋 + 𝑌, 𝑍 = 𝑋 ∗ 𝑌 y 𝑍 = 𝑋/𝑌
Caso: 𝒁 = 𝑿 + 𝒀
𝑥 + 𝑦 ≤ 𝑧 ; 𝑦 = 𝑧 − 𝑥
Sean las pdf:
𝑓𝑋(𝑥) =1
√2𝜋exp (−
𝑥2
2) ; 𝑓𝑌(𝑦) =
1
√2𝜋exp (−
𝑦2
2)
𝑓𝑍(𝑧) = ∫ 𝑓𝑋𝑌(𝑥, 𝑧 − 𝑥)𝑑𝑥
∞
−∞
Independientes:
𝑓𝑍(𝑧) = ∫ 𝑓𝑋(𝑥)𝑓𝑌(𝑧 − 𝑥)𝑑𝑥
∞
−∞
𝑓𝑍(𝑧) = ∫1
√2𝜋exp (−
𝑥2
2) ∙
1
√2𝜋exp (−
(𝑧 − 𝑥)2
2) 𝑑𝑥
∞
−∞
Nueva pdf de Z:
𝒇𝒁(𝒛) =𝟏
√𝟐∙
𝟏
√𝟐𝝅𝐞𝐱𝐩 (−
𝒛𝟐
𝟒)
Una vez obtenida la pdf, se implementa el siguiente programa en
MatLab:
clc clear close all x=random('norm',0,1,[1,1000]); y=random('norm',0,1,[1,1000]); z=x+y; [h,t]=hist(z,50);
aux=sum(h)*(t(2)-t(1)); bar(t,h/aux); pdf_z=pdfz_norm(t); hold on plot(t,pdf_z,'r'); hold off xlabel('z') ylabel('f(z)')
Se genera v. a. para X e Y para una pdf N(0,1), y se sigue el mismo
procedimiento que en caso anterior.
También ha sido necesario crear una función “pdfz_norm” en la
cual se genera la nueva pdf a partir del análisis matemático:
function y=pdfz_norm(t) n=max(size(t)); y=zeros(1,n); for i=1:n y(i)=1/(2*sqrt(pi))*exp(-
t(i)^2/(2*sqrt(2)^2)); end
Los resultados gráficos son presentados a continuación:
Fig. Pdf caso: Z=X+Y (1000 v. a.)
Como se puede observar para una pdf dada por N(0,1) en X e Y, la
transformación Z=X+Y genera una función de distribución pdf que
presenta la misma forma que X e Y, se lo evidencia gráficamente y en
la forma de la función obtenida analíticamente.
En rojo se observa la pdf que se la puede considerar ideal puesto
que tiene una función matemática asociada, mientras que el
histograma representa la distribución de las variables aleatorias
generadas, para el caso de 1000 v. a. e
Fig. Pdf caso: Z=X+Y (100000 v. a.)
Es evidente que cuando se aumenta la cantidad de v. a., el
histograma se aproxima más a la pdf generada a partir de la función
matemática asociada.
Caso: 𝒁 = 𝑿/𝒀
𝑍 = 𝑋/𝑌, 𝑊 = 𝑌, 𝑌 = 𝑊
⇒ 𝑋 = 𝑍𝑊
𝑓𝑋,𝑌(𝑥, 𝑦) = 𝑓𝑋(𝑥) ∙ 𝑓𝑌(𝑦)
𝑓𝑍,𝑊(𝑧, 𝑤) = |𝐽|𝑓𝑋,𝑌(𝑥, 𝑦)
𝑓𝑍,𝑊(𝑧, 𝑤) = |𝐽|𝑓𝑋,𝑌(𝑧𝑤, 𝑤)
𝑓𝑍,𝑊(𝑧, 𝑤) = |𝐽|𝑓𝑋(𝑧𝑤)𝑓𝑌(𝑤)
|𝐽| = |𝑤|
𝑓𝑍,𝑊(𝑧, 𝑤) = |𝑤|𝑓𝑋(𝑧𝑤)𝑓𝑌(𝑤)
𝑓𝑍(𝑧) = ∫ |𝑤|𝑓𝑋(𝑧𝑤)𝑓𝑌(𝑤)𝑑𝑤
∞
−∞
𝑓𝑍(𝑧) = ∫ |𝑤|1
√2𝜋exp (−
(𝑧𝑤)2
2) ∙
1
√2𝜋exp (−
𝑤2
2) 𝑑𝑤
∞
−∞
𝒇𝒁(𝒛) =𝟏
𝝅(𝟏 + 𝒛𝟐) ; 𝑺𝒊 − ∞ < 𝒛 < ∞
Una vez obtenida la pdf, se implementa el siguiente programa en
MatLab:
clc clear close all x=random('norm',0,1,[1,1000]); y=random('norm',0,1,[1,1000]); z=x/y; [h,t]=hist(z,50); aux=sum(h)*(t(2)-t(1)); bar(t,h/aux); pdf_z=pdfz_norm(t);
hold on plot(t,pdf_z,'r'); hold off xlabel('z') ylabel('f(z)')
Se genera v. a. para X e Y para una pdf N(0,1), y se sigue el mismo
procedimiento que en caso anterior.
También ha sido necesario crear una función “pdfz_norm” en la
cual se genera la nueva pdf a partir del análisis matemático:
function y=pdfz_norm(t) n=max(size(t)); y=zeros(1,n); for i=1:n y(i)=1/(pi*(1+(t(i)).^2)); end
Los resultados gráficos son presentados a continuación:
Fig. Pdf caso: Z=X/Y (100 v. a.)
En rojo se observa la pdf que se la puede considerar ideal puesto
que tiene una función matemática que representa a la pdf, mientras
que el histograma representa la distribución de las variables aleatorias
generadas, para el caso de 100 v. a. e
Fig. Pdf caso: Z=X/Y (1000 v. a.)
Si se aumenta la cantidad de v. a., el histograma se aproxima más a
la pdf generada a partir de la función matemática asociada.
IV. CONCLUSIONES
Es importante el conocimiento y uso de v. a. multidimensionales
debido a que en la naturaleza se puede encontrar diversos fenómenos
que se pueden describir a partir de estas, como se vio en este trabajo la
v. a. estatura es dependiente de v. a. peso, de esta manera se llega a
distintos tipos de conclusiones a través de las funciones de
probabilidad conjuntas y marginales.
Matlab permite obtener los datos de covarianza y el coeficiente de
correlación a partir de datos aleatorios, lo que permite tener una noción
de la dependencia directa que tienen cierto tipo de datos como se vio
en el análisis de la base de datos, el grado de correlación y la covarianza
se lo visualiza numéricamente y a través de las gráficas de dispersión.
Las v. a. generan cdf y pdf conjuntas que se pueden representar
mediante graficas 3D, como se vio Matlab facilita la representación
3D, haciendo posible la correcta interpretación de las funciones de
distribución para el caso de v. a. bidimensionales.
Se pudo obtener las transformaciones bidimensionales para algunos
casos partiendo de números aleatorios sujetos a una pdf se generó una
nueva pdf para una transformación dada, y se comparó con las
funciones distribución (pdf) ideales obtenidas analíticamente, de tal
manera que cuando se aumenta la cantidad de números aleatorios la
distribución de estos tiende a aproximarse a la función de distribución
ideal.
REFERENCIAS
[1] Chapra, S , “Método numéricos para ingenieros”, 5ta edición,
Mc Graw Hill, Mexico, ISBN: 970-10-6114-4
[2] Schaum, Monson. H, Outline of Theory and Problems of Digital Signal
Processing, McGraw Hill, 2nd Ed., 2011.
[3] Diniz. P, Digital Signal Processing: System Analysis and Design,
Cambridge University Press, 2nd Ed., 2010