1 Intro · M.D. Anderson Cancer Center Slide 1 Outline 1. ... 1 Intro 1.1 Data Slide 2 Data ... •...

4
Applied MCMC II: Protein Mass/Charge Spectra Peter M¨ uller, Kim-Anh Do, Keith Baggerly and Raj Bandyopadhyay Dpt of Biostatistics and Applied Mathematics M.D. Anderson Cancer Center Slide 1 Outline 1. Data: MALDI-TOF 2. Model: mixture of Beta; prior 3. Posterior MCMC: RJ 4. Mixture of Beta: Results 5. Mixture of Gamma/Gamma 1 Intro 1.1 Data Slide 2 Data Biology: DNA RNA proteins cellular biologic functions MALDI-TOF: measures mass/charge ratios of ionized proteins Matrix Assisted Laser Desorption Ionization: Suspend a sample in a matrix Laser ionizes molecules from sample (laser-induced desorption process) Electric field accelerates particles Time Of Flight: separates ions by mass/charge TOF (m/z) 1/2 Measure the proportions of ions with size m/z Slide 3 Raw Data 0 50000 100000 150000 200000 0 50 100 150 M/Z RATIO f 0 50000 100000 150000 200000 0 50 100 150 M/Z RATIO f normal tumor n 0 = 17 normal samples, n 1 = 24 tumor samples; on grid of size I = 60, 000. 1.2 Current Stepwise Methods Slide 4 Current Methods Multi-step: 1. Remove noise Window smoother (Baggerly et al. 2003 Proteomics) DWT wavelet transform, thresholding & shrinkage (Coombes et al., 2004) Spline based (Billheimer, 2004) 2. Remove baseline. 3. “Peak detection” on cleaned data as local maxima. 4. Group comparison on peak hights (and/or coarsened data) Ideal: (1)-(4) simultaneously, for full data. 1.3 Likelihood based inference Slide 5 Likelihood based inference Sampling model: spectrum = histogram of observed counts k-th sample: p k (m i ) = frequency of m/z ratio m i . Decompose: into background B k and protein peaks f k . Background: detector noise, protein fragments, matrix ... Protein peaks: each protein with m/z ratio m plus noise due to initial velocity dist & mmt error peak centered around m. Inference: Prob model for f k and B k inference on peaks, and expression of peaks across conditions. 1

Transcript of 1 Intro · M.D. Anderson Cancer Center Slide 1 Outline 1. ... 1 Intro 1.1 Data Slide 2 Data ... •...

Applied MCMC II: Protein Mass/ChargeSpectra

Peter Muller, Kim-Anh Do, Keith Baggerly and RajBandyopadhyay

Dpt of Biostatistics and Applied MathematicsM.D. Anderson Cancer Center

Slide 1

Outline

1. Data: MALDI-TOF

2. Model: mixture of Beta; prior

3. Posterior MCMC: RJ

4. Mixture of Beta: Results

5. Mixture of Gamma/Gamma

1 Intro

1.1 Data

Slide 2

Data

Biology: DNA → RNA → proteins → cellular biologicfunctions

MALDI-TOF: measures mass/charge ratios of ionizedproteins

• Matrix Assisted Laser Desorption Ionization:– Suspend a sample in a matrix– Laser ionizes molecules from sample

(laser-induced desorption process)– Electric field accelerates particles

• Time Of Flight: separates ions by mass/charge– TOF ∝ (m/z)1/2

– Measure the proportions of ions with size m/z

Slide 3

Raw Data

0 50000 100000 150000 200000

050

100

150

M/Z RATIO

f

0 50000 100000 150000 200000

050

100

150

M/Z RATIO

f

normal tumor

n0 = 17 normal samples, n1 = 24 tumor samples; on grid ofsize I = 60, 000.

1.2 Current Stepwise Methods

Slide 4

Current MethodsMulti-step:

1. Remove noise

• Window smoother (Baggerly et al. 2003Proteomics)

• DWT wavelet transform, thresholding & shrinkage(Coombes et al., 2004)

• Spline based (Billheimer, 2004)

2. Remove baseline.

3. “Peak detection” on cleaned data as local maxima.

4. Group comparison on peak hights (and/or coarseneddata)

Ideal: (1)-(4) simultaneously, for full data.

1.3 Likelihood based inference

Slide 5

Likelihood based inference

Sampling model: spectrum = histogram of observedcounts

k-th sample:

pk(mi) = frequency of m/z ratio mi.

Decompose: into background Bk and protein peaks fk.

• Background: detector noise, protein fragments,matrix . . .

• Protein peaks: each protein with m/z ratio m plusnoise due to initial velocity dist & mmt error→ peak centered around m.

Inference: Prob model for fk and Bk →inference on peaks, and expression of peaks acrossconditions.

1

2 Model

2.1 Mixture of Beta

Slide 6

Mixture of Betas

• Bernstein poly priors (Petrone 1999ab)

• Generalize to unconstrained par’s (Robert & Rousseau,2002); for interpretability and parsimony

• kernels Be(m, s), location m, scale s.

fk(m) =J∑

j=1

wxj Be(m; εj , αj)

biologic cond x = xk

• Common location εj (= protein) across biolog cond’s;different weight wxj (= expression).

• Random number of peaks J

Slide 7

Baseline: Similar mixture of Betas:

Bk(y) =Jk∑

j=1

vkj Be(mi|ηkj , βkj).

with random size Jk mixture

Spectrum: observed count = peaks + baseline

pk(m) = p0kBk(m) + (1− p0k)fk(m)

2.2 Likelihood

Slide 8

Likelihood:

• Recorded spectrum = counts of detector events

• ykm count of events at mass m with pk(m).

• Usual likelihood: ykm is true pk plus noise,i.e., regression.

• Density estimation:ykm as empirical distr of n samples from pk.

log p(y | θ) =K∑

k=1

I∑i=1

yki log pk(mi)

• Following disc indep of assumed likelihood.

2.3 Prior

Slide 9

Hierarchical Prior: Recall fk(m) =∑J

j=1 wxj Be(m; εj , αj)

Peaks: εj ∼ U(0, 1), αj ∼ U(α, α)

Number peaks: J ∼ Poi+(R1)

Differential expression:

λj = I(w0j = w1j),

indicator for non-diff expr, with Pr(λj = 1) = π

Weights: Dir prior.

Baseline: Similar for the sample k baseline

Proportion baseline: Finally, p0k ∼ Be(C0,M0)

Slide 10

Robert and Rousseau (2002):

• Any continuous density on [0, 1] can be approximatedby pk

(within ε under KL divergence).

• (Reasonable) constraints on the prior model and i.i.d.sampling→ posterior consistency (under Hellinger distance).

• More important: dependent sampling, and additivenoise.

3 Posterior Simulation

3.1 MCMC

Slide 11

Posterior Simulation

MCMC: Most updates straightforward, except for J, Jk, λj .

RJ: [J | . . .] and [Jk | . . .]: RJ with

• split/merge, a pain – but the usual pain :-)• birth/death, using a reference solution• Simulated tempering to mitigate slow mixing.

2

3.2 RJ MCMC

Slide 12

RJ for Location/Scale Mixtures

Location/Scale mixtures: Assume the sampling modelinvolves a location/scale mixtures

f(·) =∑

wjfj(·; µj , σj)

e.g., protein peaks fx(·) in the example.

Possibly multiple functions f(·)e.g., Bk(·) for k = 1, . . . ,K.

Informal interpretation of (µj , σj) as location and scale.

Slide 13

• Define generic Split/merge and birth/death moves.Problem specific arguments:

Likelihood function: evaluate joint likelihood withthe currently imputed mixture.The RJ does not need to know the details of thelikelihood function.

Pior: p(µj , σj , wj)

Reference solution: fo(·) for each mixture in themodel.Used to propose a birth in birth/death.

3.3 R functions

Slide 14

R functions:

RJ SplitMerge(params, funcs, mcmc,data)

• params: currently imputed mixture pars.List with matrices for locations µkj , scales σkj ,and weights wkj for mixtures fk(·), k = 1, . . . ,K.

• mcmc: MCMC tuning parameters.• funcs: list of functions (likelihood and prior(s)).• data: data matrix, passed as argument to the

likelihood function.

The program need not know how the mixture functionsare used in the likelihood. Only need to know thenumber of mixtures (K + 1 in the example)

Split Proposal: randomly select a peak, split into twodaughters, maintaining 1st and 2nd moment(interpreting scale as s.d.) and constraining to nearestneighbors.

Slide 15

RJ BirthDeath(params, funcs, ref, mcmc,data)

• ref: reference solution.

Birth Proposal: randomly select a peak in ref andpropose to add a jittered version.

4 Results

Slide 16

Mixture of Beta: ResultsEstimated spectra

50000 100000 150000 200000

05

1015

M/Z RATIO

F

50000 100000 150000 200000

05

1015

M/Z RATIO

F

(a) E[fk(·) | Y ], (b) E[fk(·) | Y ],normal xk = 0 tumor xk = 1

E[fk(m) | Y, xk = x]. Estimated spectrum for normal andtumor samples.

Slide 17

Prob Model on fk:

50000 100000 150000 200000

05

1015

M/Z RATIO

F

50000 100000 150000 200000

05

1015

M/Z RATIO

F

(a) fk ∼ p[fk(·) | Y ], (b) fk ∼ p[fk(·) | Y ],normal xk = 1 tumor xk = 1

Random draws from the posterior on the unknown spectra.

Slide 18

Differential Expression

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

Z

E(la

mbd

a | Y

)

●●

● ●

●●

● ●

●●

NON−DIFFDIFF

3

E(1− λj | Y ). Posterior expected probability of differentialexpression.

Slide 19

MCMC Mixing

0.0 0.2 0.4 0.6 0.8 1.0

020

040

060

080

0

M/Z

ITE

RA

ION

||| ||| | | |||| || | | | | |||| | | | | | |||| | | | || ||||| | | | || |||||| | | | || |||||| | | | || |||| | | | | |||| | | | || | ||||| | | | || |||||| | | | || ||||| || | | || ||||| || | | || | ||||| || | | || ||||| || | | || ||||| || | || || ||||| || | || || |||||| || | || || ||||||| ||| | || || ||||||| |||| | || ||| ||||| ||| | || || | ||||||||| | || ||| |||||||||| | || ||| ||||||||||| | || ||| | |||||||||| | || || | |||||||||| | || || | ||||||||| | || || | |||||||||| | || || | ||||||||||| | | | || | |||||||||| | | | || | | |||||||||| | | | || | | ||||||||| | | | || | | ||||||||| | || || | | ||||||||| | ||| || | | |||||||||| | ||| || | | |||||||||| | ||| || | | ||||||||||| | ||| || | | ||||||||||| | ||| || | | |||||||||| | ||| || | | ||||||||| | ||| || | | ||||||||| | ||| || | | ||||||||| | ||| || | | ||||||||| | ||| ||| | | |||||||||| | ||| ||| | | |||||||||| | || ||| | | ||||||||| | || ||| | | ||||||||| | || ||| | | ||||||||| | || ||| | | |||||||| | || ||| | | |||||||| | || ||| | | |||||||| | || ||| | | |||||||| | ||| ||| | | |||||||| | ||| ||| | | | |||||||| | |||| ||| | | | |||||||| | ||||| ||| | | | |||||||| | ||||| ||| | | |||||||| | |||| ||| | | |||||||| | |||| ||| | | |||||||| | |||| ||| | | |||||||| | |||| ||| | | ||||||||| | |||| ||| | | |||||||| | |||| ||| | | |||||||| | |||| ||| | | ||||||||| || |||| ||| | | ||||||||| || |||| ||| | | ||||||||| || |||| ||| | | |||||||||| || ||||| ||| ||| |||||||||| || ||||| ||| | | |||||||||| | || ||||| ||| | | |||||||||| | || ||||| ||| | | |||||||||| | || ||||| ||| | | |||||||||| | || |||| ||| | | |||||||||| | || |||| ||| | | |||||||||| | || |||| ||| | | |||||||||| | | |||| ||| | | |||||||||| | | |||| ||| | | |||||||||| | | |||||| ||| | | ||||||||| | | |||||| ||| | | |||||||| | || |||||| ||| | | ||||||||| | || |||||| ||| | | |||||||||| | || |||||| ||| | | ||||||||| | ||||||| ||| | | ||||||||| | |||||| ||| | | |||||||||| | |||||| ||| | | | |||||||||| | |||||| ||| | | |||||||||| | ||||| ||| | | |||||||||| | ||||| ||| | | |||||||||| | | |||| ||| | | ||||||||| | | |||| ||| | | ||||||||| | || ||| ||| | | ||||||||| | || ||| ||| | | | ||||||||| | || ||| ||| | | | ||||||||| | || ||| ||| | | | ||||||||| | || ||| ||| | | | ||||||||| | || ||| ||| | | | ||||||||| | || ||| || | | | ||||||||| | || ||| || | | | ||||||||| | || ||| || | | | ||||||||| | || ||| || | | | |||||||| | | ||| || | | |||||||| | | ||| || | | |||||||| | | ||| || || | |||||||| | | ||| || || | |||||||| | | ||| || || | ||||||||| | | |||| || || | |||||||||| | | |||| || | | |||||||||| | | |||| || | | |||||||||| | | |||| || | | |||||||||| | | |||| || | | |||||||||| | | |||| || | | |||||||||| | | |||| || | | |||||||||| | | |||| || | | |||||||||| | | |||| || | | |||||||||| | | |||| || | | |||||||||| | | |||| || | | ||||||||||| | | |||| || | | | ||||||||||| | | ||| || | | | ||||||||||| | | ||| || | | | ||||||||||| | |||| || | | | ||||||||||| | | ||| || | | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | || || || | | ||||||||||| | || || || | | |||||||||||| | || || || | | ||||||||||| | || || || | | ||||||||||| | || || || | | ||||||||||| | || || || | | ||||||||||| | | || || | | |||||||||| | | || || | | |||||||||| | | || || | | |||||||||| | | || || | | |||||||||| | | || || | | |||||||||| | | || || | | ||||||||||| | ||| || || | | ||||||||||| | ||| || || | | ||||||||||| | ||| ||| || | | ||||||||||| | | ||| || | | ||||||||||| | | || || | | ||||||||||| | | || || | | |||||||||| | | || || | | |||||||||| | | ||| || | | ||||||||| || | ||| || | | |||||||||| | | ||| || | | ||||||||||| | | |||| || | | |||||||||| | | |||| || | | |||||||||| | | |||| || | | |||||||||| | | |||| || | | |||||||||| | | |||| || | | |||||||||| | | |||| || | | ||||||||||| | |||| || | | |||||||||| | | |||| || | | |||||||||| | | |||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | ||||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | ||||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | || || | | |||||||||| | | || || | | |||||||||| | | || || | | |||||||||||| | | || || | | |||||||||||| | | || || | | |||||||||||| | | || || | | |||||||||||| | | || || | | |||||||||||| | | || || | | ||||||||||| | | || || | | |||||||||| || | || || | | ||||||||||||| | || || | | ||||||||||||| | || || | | |||||||||||| | | || || | | |||||||||||| | | || || | | ||||||||||| || | || || | | |||||||||| || | || || | | ||||||||||| || | || || | | |||||||||||| | | || || | | |||||||||||| | | || || | | |||||||||||| | | || || | | |||||||||||| | | || || | | |||||||||||| | | || || | | |||||||||||| | | || || | | ||||||||||| | | || || | | ||||||||||| | | || || | | ||||||||||| | | || || | | ||||||||||| | | || || | | ||||||||||| | | || || | | |||||||||||| | | || || | | | ||||||||||| | | || || | | ||||||||||| | | || || | | ||||||||||| | | || || | | | ||||||||||| | | || || | | | |||||||||| | | || || | | | | |||||||||| | | || || | | | | |||||||||| | | || || | | | |||||||||| | | || || | | | ||||||||| | | || || | | |||||||||| | | || || | | ||||||||| | | || || | | ||||||||| | | || || | | ||||||||| | | || || | | ||||||||| | | || || | | ||||||||| | | || || | | ||||||||| | | || || | | ||||||||| | | || || | | ||||||||| | | || || | | ||||||||| | | || || | | ||||||||| | | || || | | |||||||||| | | ||| || | | ||||||||||| | | ||| || | | ||||||||||| | | ||| || | | ||||||||||| | | ||| || | | |||||||||||| | | ||| || | | |||||||||||| | | ||| || | | |||||||||||| | | ||| || | | |||||||||||| | | ||| || | | |||||||||||| | | ||| || | | ||||||||||| | || ||| || | | ||||||||||| | || ||| || | | |||||||||| | || ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | | ||| || | | |||||||||| | || ||| || | | |||||||||| | || ||| || | | |||||||||| | || ||| || | | |||||||||| | || || || | | |||||||||| | | || || | | |||||||||| | | || || | | |||||||||| | | || || | | |||||||||| | |||| || | | |||||||||| | || || || | | |||||||||| | |||| || | | |||||||||| | || || || | | |||||||||| | |||| || | | |||||||||| | |||| || | | |||||||||| |||| || | | |||||||||| |||| || | | |||||||||| |||| || | | ||||||||| |||| || | | ||||||||| |||| || | | ||||||||| |||| || | | ||||||||| |||| || | | ||||||||| |||| || | | ||||||||| | ||| || | | ||||||||| | ||| || | | ||||||||| | ||| || | | ||||||||| | ||| || | | ||||||||| | ||| || | | ||||||||| | ||| || | | |||||||||| | ||| || | | |||||||||| | ||| || | | |||||||||| | ||| || | | |||||||||| || ||| || | | |||||||||| || ||| || | | |||||||||| || ||| || | | |||||||||| || ||| || | | ||||||||||| || ||| || | | |||||||||| || ||| || | | |||||||||| || ||| || | | |||||||||| || ||| || | | |||||||||| ||||| || | | |||||||||| || ||| || | | |||||||||| | || ||| || | | |||||||||| ||||| || | | ||||||||||| ||||| || | | ||||||||||| ||||| || | | ||||||||||| ||||| || | | | ||||||||||| ||||| || | | | ||||||||||| ||||| || | | | ||||||||||| ||||| || | | | ||||||||||| ||||| || | | | ||||||||||| |||| || | | | ||||||||||| |||| || | | | |||||||||| |||| || | | | |||||||||| |||| || | | | |||||||||| |||| || | | | ||||||||||| |||| || | | | ||||||||||| || || || | | | ||||||||||| || || || | | | ||||||||||| || || || | | | ||||||||||| || || || | | | ||||||||||| || || || | | | ||||||||||| || || || | | | ||||||||||| || || || | | | ||||||||||| || || || | | | ||||||||||| || || || | | | | ||||||||||||| |||| || | | | |||||||||||||| |||| || | | | | |||||||||||||| |||| || | | | | |||||||||||||| |||| || | | | | |||||||||||| | ||| || | | | | |||||||||||| | ||| || | | | | |||||||||||| |||| || | | | ||||||||||||| | ||| || | | | |||||||||||| |||| || | | | |||||||||||| |||| || | | | |||||||||||| |||| || ||| | |||||||||||| | | |||| || ||| | |||||||||||| ||||| || | | | |||||||||||| | ||| || | | | |||||||||||| | | ||| || | | | |||||||||||| | ||| || | | | |||||||||||| | | ||| || | | | ||||||||||| | | ||| || | | | ||||||||||| | | ||| || | | | ||||||||||| | | ||| || | | | ||||||||||| | | ||| || | | | ||||||||||| | ||| || | | | ||||||||||| | ||| || | | || ||||||||||| | ||| || | | | ||||||||||| | ||| || | | | ||||||||||| | ||| || | | | ||||||||||| | ||| || | | | ||||||||||| | | ||| || | | | |||||||||||| | ||| || | | | |||||||||||| | ||| || | | | |||||||||||| | ||| || | | | |||||||||||| | | ||| || | | | |||||||||||| | ||| || | | | |||||||||||| | ||| || | | |||||||||||| | || || | | |||||||||||| | || || | | |||||||||||| | || || | | |||||||||||| | || || | | |||||||||||| | || || | | |||||||||||| | || || | | |||||||||||| | || || | | |||||||||||| | || || | | |||||||||||| | || || | | |||||||||||| | || || | | ||||||||||| | || || | | ||||||||||| | || || | | ||||||||||| | || || | | ||||||||||| | ||| || | | ||||||||||| | ||| || | | ||||||||||| | ||| || | | ||||||||||| | || || | | ||||||||||| | || || | | ||||||||||| | || || | | ||||||||||| | || || | | |||||||||||| | || || | | |||||||||||| | || || | | |||||||||||| | || || | | |||||||||||| | || || | | |||||||||||| | || || | | |||||||||||| | || || | | |||||||||||||| | || || | | |||||||||||||| | || || | | |||||||||||||| | || || | | |||||||||||||| | || || | | |||||||||||||| | || || | | |||||||||||||| | || || | | |||||||||||||| | || || | | ||||||||||||| | || || | | ||||||||||||| | || ||| | | ||||||||||||| | || ||| | | ||||||||||||| | || ||| | | ||||||||||||| | || ||| | | ||||||||||||| | || || | | ||||||||||||| | || || | | | ||||||||||||| | || || | | ||||||||||||| | || || | | ||||||||||||| | || || | | ||||||||||||| | || || | | ||||||||||||| | || || | | ||||||||||||| | || || | | |||||||||||||| | || || | | ||||||||||||| | || || | | |||||||||||| | || || | | |||||||||||| | || || | | ||||||||||| | || || | | ||||||||||| | || || | | ||||||||||| | || || | | ||||||||||| | || || | | ||||||||||| | || || | | |||||||||||| | || || | | |||||||||||| | || || | | |||||||||||| | || || | | |||||||||||| | || || | | |||||||||||| | || || | | |||||||||||| | || || | | |||||||||||| | || || | | |||||||||||| | || || | | ||||||||||| | || || | | ||||||||||| | | || | | |||||||||| | || || | | |||||||||| | || || | | ||||||||||| | | || | | |||||||||| | | || | | ||||||||||| | | || | | |||||||||| | || || | | |||||||||| | || || | | |||||||||| | || || | | ||||||||| | || || | | ||||||||| | || || | | |||||||| | || || | | ||||||||| | || || | | ||||||||| | || || | | ||||||||| | || || | | |||||||||| | || || | | ||||||||| | || || | | ||||||||| | || | || | | ||||||||| | || | || | | ||||||||| | || | || | | ||||||||| || || | || | | ||||||||| || || | || | | ||||||||| || || | || | | ||||||||| || || | || | | ||||||||| || || | || | | ||||||||| |||| || | | ||||||||| |||| || | | ||||||||| |||| || | | ||||||||| |||| || | | ||||||||| |||| || | | ||||||||| |||| || | | ||||||||| |||| || | | ||||||||| |||| || | | |||||||||| |||| || | | |||||||||| |||| || | | |||||||||| | |||| || | | |||||||||| | |||| || | | |||||||||| |||| || | | |||||||||| |||| || | | |||||||||| |||| || | | ||||||||||| |||| || | | |||||||||| |||| || | | |||||||||| |||| || | | |||||||||| |||| || | | |||||||||| |||| || | | ||||||||||| || || || | | ||||||||||| || || || | | ||||||||||| |||| || | | ||||||||||| |||| || | | ||||||||||| |||| || | | ||||||||||| |||| || | | ||||||||||| |||| || | | |||||||||| |||| || | | |||||||||| |||| || | | ||||||||| |||| || | | ||||||||| || || || | | ||||||||| ||| || || | | | ||||||||| ||||| || | | ||||||||| ||||| || | | ||||||||| ||| || || | | ||||||||| ||| || || | | ||||||||| ||| || || | | ||||||||| || || || | | ||||||||| || ||| || | | ||||||||| || ||| || | | ||||||||| || ||| || | | ||||||||| || ||| || | | ||||||||| || ||| || | | ||||||||| || || || | | ||||||||| |||| || | | ||||||||| || || || | | ||||||||| || || || | | ||||||||| |||| || | | |||||||||| |||| || | | |||||||||| |||| || | | |||||||||| |||| || | | |||||||||| |||| || | | |||||||||| |||| || | | |||||||||| |||| || | | |||||||||| || || || | | ||||||||||| |||| || | | ||||||||| || || || | | ||||||||| || || || | | ||||||||| || || || | | ||||||||| |||| || | | ||||||||| |||| || | | ||||||||| |||| || | | ||||||||| |||| || | | ||||||||||| |||| || | | |||||||||| |||| || | | |||||||||| || || || | | |||||||||| || || || | | |||||||||| || || || | | |||||||||| || || || | | ||||||||||| || || || | | ||||||||||| || || || | | ||||||||||| || || || | | ||||||||||| || || || | | ||||||||||| || || || | | ||||||||||| || ||| || | | ||||||||||| ||||| || | | ||||||||||| |||||| || | | ||||||||||| |||||| || | | |||||||||||| |||||| || | | | |||||||||||| |||||| || | | | |||||||||||| |||||| || | | | |||||||||||| |||||| || | | | ||||||||||| ||| ||| || | | | ||||||||||| |||||| || | | | ||||||||||| |||||| || | | | ||||||||||| |||||| || | | | ||||||||||| |||||| || | | | ||||||||||| |||||| || | | | ||||||||||| ||||| || | | | ||||||||||| || ||| || | | | ||||||||||| || ||| || | | ||||||||||| || ||| || | | ||||||||||| || ||| || | | ||||||||||| || ||| || | | ||||||||||| || ||| || | | ||||||||||| || ||| || | | ||||||||||| || ||| || | | ||||||||||| || ||| || | | ||||||||||| || ||| || | | ||||||||||| || ||| || | | ||||||||||| || ||| || | | |||||||||| ||||| || | | |||||||||| || ||| || | | |||||||||| || ||| || | | ||||||||| || ||| || | | ||||||||| || ||| || | | ||||||||| ||||| || | | ||||||||| || ||| || | | ||||||||| ||||| || | | |||||||||| ||||| || | | ||||||||| ||||| || | | ||||||||| ||||| || | | ||||||||| ||||| || | | ||||||||| |||| || | | ||||||||| || || || | | ||||||||| || || || | | ||||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | ||||||||| || ||| || | | ||||||||| || || || | | |||||||||| || ||| || | | ||||||||| || || || | | ||||||||| || || || | | ||||||||| || || || | | ||||||||| || || || | | |||||||| || || || | | ||||||||| |||| || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| | || || || | | ||||||||| || || || | | ||||||||| || || || | | ||||||||| || || || | | |||||||||| || || || | | |||||||||| |||| || | | | |||||||||| |||| || | | | |||||||||| |||| || | | | |||||||||| || || || | | | |||||||||| || || || | | | ||||||||| || || || | | | ||||||||| || || || | | | ||||||||| || || || | | | ||||||||| || || || | | | ||||||||| || || || | | | ||||||||| || || || | | | ||||||||| || || || | | | ||||||||| || || || | | | ||||||||| || || || | | | ||||||||| || || || | | | ||||||||| | || || || | | | ||||||||| || || || | | ||||||||| || || || | | ||||||||| || || || | | ||||||||| || || || | | ||||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | ||||||||| || || || | | ||||||||| || || || | | ||||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| |||| || | | |||||||| |||| || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | | |||||||| || || || | | | |||||||| || || || | | |||||||| || || || | | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | |||||||| || || || | | | |||||||| || || || | | | |||||||| || || || | | | |||||||| || || || | | | |||||||| |||| || | | |||||||| || || || | | |||||||| || || || | | |||||||| |||| || | | |||||||| |||| || | | |||||||| |||| || | | |||||||| ||||| || | | |||||||| ||||| || | | |||||||| || ||| || | | |||||||| || |||| || | | ||||||||| |||||| || | | |||||||| || |||| || | | |||||||| || |||| || | | |||||||| |||||| || | | |||||||| |||||| || | | |||||||| |||||| || | | |||||||| |||||| || | | |||||||| |||||| || | | |||||||| |||||| || | | | |||||||| |||||| || | | |||||||| |||||| || | | | |||||||| ||||| || | | |||||||| ||| || || | | | |||||||| ||| || || | | |||||||| ||||| || | | | |||||||| ||||| || | | | |||||||| ||||| || | | | |||||||| ||||| || | | | |||||||| ||||| || | | | |||||||| ||||| || | | | |||||||| ||||| || | | | |||||||| ||||| || | | | |||||||| ||||| || | | | |||||||| ||||| || | | | |||||||| ||||| || | | | |||||||| ||||| || | | |||||||| ||||| || | | |||||||| ||||| || | | |||||||| ||||| || | | |||||||| ||||| || | | | |||||||| |||||| || | | | |||||||| |||||| || | | |||||||| |||||| || | | |||||||| |||||| || | | |||||||| |||||| || | | |||||||| |||||| || | | |||||||||| |||||| ||| | | ||||||||| |||||| ||| | | ||||||||| |||||| ||| | | ||||||||| ||||| ||| | | ||||||||| ||||| ||| | | ||||||||| ||||| ||| | | ||||||||| ||||| ||| | | ||||||||| ||||| ||| | | ||||||||| ||||| ||| | | ||||||||| |||||| ||| | | ||||||||| |||||| || | | ||||||||| |||||| || | | ||||||||| ||||| || | | ||||||||| ||||| || | | ||||||||| | ||| || | | ||||||||| |||| || | | ||||||||| | || || | | ||||||||| | || || ||| ||||||||| | || || ||| ||||||||| | || || | || ||||||||| | || || ||| ||||||||| | || || | | ||||||||| | || || | | ||||||||| | || || | || |||||||||| | || || | || |||||||||| | || || | || |||||||||| | || || | || ||||||||| | || || | || ||||||||| | | || || | || | ||||||||| | || || | || ||||||||| | || || | | ||||||||| | | || || | | ||||||||| | | || || | | ||||||||| | || || | | ||||||||| | | || || | | ||||||||| | || || | | ||||||||| | || || | | ||||||||| | || || | | ||||||||| | || || | | ||||||||| | || || | | ||||||||| | || || | | ||||||||| | || || | | ||||||||| | || || | | ||||||||| | || || | | ||||||||| | || || | | ||||||||| | || || | | ||||||||| | || || | | ||||||||| | || || | | ||||||||| | || || | | ||||||||| | || || | | | ||||||||| | || || | | | ||||||||| | || || | | | ||||||||| | || || | | | ||||||||| | | || || | | ||||||||| | ||| || | | ||||||||| | ||| || | | ||||||||| | ||| || | | ||||||||| | ||| || | | ||||||||| | || || | | ||||||||| | || || | | ||||||||| | || || | | ||||||||| | || || | | |||||||||| | || || | | |||||||||| | || || | | |||||||||| | || || | | |||||||||| | || || | | |||||||||| | || || | | |||||||||| | ||| || | | ||||||||||| | ||| || | | ||||||||||| | ||| || | | | | ||||||||||| | ||| || | | | ||||||||||| | ||| || | | | ||||||||||| | ||| || | | | |||||||||| | ||| || | | | |||||||||| | ||| || | | |||||||||| | ||| || | | |||||||||| | ||| || | | |||||||||| | ||| || || | ||||||||||| || ||| || || | ||||||||||| || ||| || || | ||||||||||| || ||| || || | ||||||||||| || ||| || || | ||||||||||| || ||| || ||| ||||||||||| || ||| || ||| ||||||||||| || ||| || || | |||||||||| ||| ||| || ||| |||||||||| || ||| || || | |||||||||| || ||| || || | |||||||||| || ||| || || | ||||||||| || ||| || || | ||||||||| || ||| || || | ||||||||| || ||| || || | ||||||||| ||||| || || | ||||||||| || ||| || || | |||||||||| || ||| || || | ||||||||| || ||| || | | ||||||||| || || | || | | ||||||||| || ||| || | | ||||||||| || ||| || | | | ||||||||| || ||| || | | ||||||||| ||||| || | | ||||||||| ||||| || | | ||||||||| || ||| || | | ||||||||| || ||| || | | ||||||||| || ||| || | | ||||||||| || ||| || | | | ||||||||| || ||| || | | | ||||||||| |||||| || | | | ||||||||| || |||| || | | ||||||||| || |||| || | | ||||||||| || ||||| || | | ||||||||| ||||||| || | | ||||||||| |||||| || | | ||||||||| || |||| || | | ||||||||| |||||| || | | ||||||||| || |||| || | | ||||||||| |||||| || | | ||||||||| ||||||| || | | ||||||||| |||||| || | | |||||||||| ||||| || | | |||||||||| || ||| || | | |||||||||| || |||| || | | ||||||||||| |||||| || | | ||||||||||| ||||| || | | ||||||||||| | || ||| || | | ||||||||||| || ||| || | | |||||||||||| | || ||| || | | |||||||||||| | || ||| || | | |||||||||||| ||||| || | | |||||||||||| ||||| || | | |||||||||||| || ||| || | | |||||||||||| || ||| || | | |||||||||||| || ||| || | | |||||||||||| || |||| || | | |||||||||||| || |||| || | | |||||||||||| || |||| || | | |||||||||||| || ||| || | | |||||||||||| || ||| || | | |||||||||||| || ||| || | | |||||||||||| || ||| || | | ||||||||||||| || |||| || | | ||||||||||||| || ||||| || | | ||||||||||||| || ||||| || | | ||||||||||||| || |||| || | | ||||||||||||| || |||| ||| | | ||||||||||||| || |||| ||| | | ||||||||||||| || |||| ||| | | |||||||||||||| || |||| ||| | | |||||||||||||| || |||| ||| | | |||||||||||||| || |||| ||| | | |||||||||||||| || |||| ||| | | |||||||||||||| || |||| ||| | | |||||||||||||| || |||| ||| | | |||||||||||||| || ||| ||| | | |||||||||||||| || ||| ||| | | ||||||||||||||| || ||| ||| | | ||||||||||||||| ||| ||| ||| | | ||||||||||||||| |||||| ||| | | ||||||||||||||| ||| ||| ||| | | ||||||||||||||| |||||| ||| | | |||||||||||||||| ||| ||| ||| | | ||||||||||||||| ||| ||| ||| | | |||||||||||||| |||||| ||| | | |||||||||||||| |||||| ||| | | ||||||||||||| ||| ||| ||| | | ||||||||||||| ||| ||| ||| | | ||||||||||||| ||| ||| ||| | | ||||||||||||| ||| ||| ||| | | |||||||||||||| |||||| ||| | | |||||||||||||| ||||| ||| | | ||||||||||||| || ||| ||| | | ||||||||||||| ||||| ||| | | ||||||||||||| || ||| ||| | | ||||||||||||| |||||| ||| | | ||||||||||||| |||||| ||| | | ||||||||||||| |||||| ||| | | ||||||||||||| ||| ||| ||| | | ||||||||||||| |||||| ||| | | ||||||||||||| |||||| ||| | | ||||||||||||| |||||| ||| | | ||||||||||||| |||||| ||| | | ||||||||||||| |||||| ||| | | ||||||||||||| |||||| ||| | | ||||||||||||| |||||| ||| | | ||||||||||||| |||||| ||| | | ||||||||||||| |||||| ||| | | ||||||||||||| |||||| ||| | | ||||||||||||| |||||| ||| | | ||||||||||||| ||||||| ||| | | ||||||||||||| ||||||| ||| | | ||||||||||||| ||||||| ||| | | ||||||||||||| ||||||| ||| | | ||||||||||||| |||| ||| ||| | | ||||||||||||| ||||||| ||| | | ||||||||||||| |||||| ||| | |||||||||||||| |||||| ||| | | |||||||||||||| |||||| ||| | | |||||||||||||| |||||| ||| | | |||||||||||||| |||||| ||| | | |||||||||||||| |||||| ||| | ||||||||||||| | |||||| ||| | | |||||||||||||| |||||| ||| | | ||||||||||||| |||||| ||| | | ||

Imputed locations εj (M/Z) over iterations.

Slide 20

Number of Proteins = Mixture Size:

J

Fre

quen

cy

10 15 20 25

050

100

150

200

250

300

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●

●●●●●●●●●●●●

●●●●●●●●●

●●

●●

●●●

●●●●●●●

●●

●●●●●●●●●●●●●●

●●●●

●●●

●●●●

●●●●●●●●

●●●●●●●●●●

●●

●●●●

●●●●●●●●●●●●●●●●●●●●●

●●●●

●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●

1 2 3 4 5 6 7 8 9 10

05

1015

SAMPLE

p(Jk

| Y

)

p(J | y) p(Jk | y)N proteins baseline

Slide 21

Class comparison

• Decision δi ∈ {0, 1} for each protein =“flag protein i for differential expression acrossx = 0, 1”.

• False discovery rate (FDR) (Benjamini & Hochberg,1995):

FDR(δ, λ) =∑

λj δj∑δj

,

Function of parameters λ and decision δ (i.e. data.)

• Posterior expected FDR: Let λj = E(λj | y) and

FDR(δ, y) = E(FDR | y) =∑

λj δj∑δj

(Genovese & Wassesrman 2002, 2003).

• Can show: under reasonable loss functions optimalδ∗j = I(λj < t). Mix of beta model → easy eval of λj .

5 Mixture of Gamma/Gamma

5.1 Gamma/Gamma Hierarchical Model

Slide 22

Mixture of Gamma/Gamma Hierarchical Models Newton etal. (01, J Comp Bio), Newton & Kendziorski (03) . . .

Sampling model: observed gene expression Xij , Yij

Xij ∼ Ga(a, θ0i) and Yij ∼ Ga(a, θ1i).

gene i, slide j.

Mean expressions: θi0, θi1

θ0i ∼ Ga(a0, ν)

θ1i =

{θ0i if zi = 0∼ Ga(a0, ν) if zi = 1

Differential expression: zi ∈ {0, 1}

Pr(θ0i = θ1i) = Pr(zi = 0) = p.

5.2 Mixture Ga/Ga

Slide 23

Design: generalize to a mixture of Ga/Ga (M, Parmigiani,Robert and Rousseau, 04).

Mixture of Gammas: Re-Parametrize Ga with mean/s.d.G(m, s) and use mixture

(Xij/θ0i) ∼J∑

h=1

whGa(mh, sh)︸ ︷︷ ︸f(·)

and same for Yij ...

Slide 24

Discussion

RJ functions: • RJ for any location/scale mixture• Hides details of RJ move and acceptance prob in

an R function.• Challenging to include prior constraints across

terms in the mixture (known pairs fordouble-charged ions etc)

4