scarica quaderno

48
UNIVERSITÀ CATTOLICA DEL SACRO CUORE ISTITUTO DI STATISTICA Angelo Zanella Valutazione e modelli interpretativi di customer satisfaction: una presentazione di insieme Serie E.P. N. 105 - Ottobre 2001

Transcript of scarica quaderno

Page 1: scarica quaderno

UNIVERSITÀ CATTOLICA DEL SACRO CUORE

ISTITUTO DI STATISTICA

Angelo Zanella

Valutazione e modelli interpretativi di customer satisfaction: una presentazione di insieme

Serie E.P. N. 105 - Ottobre 2001

Page 2: scarica quaderno

Finito di stampare nel mese di ottobre 2001 presso l’Istituto di Statistica

dell’Università Cattolica del Sacro Cuore Largo Gemelli 1 – 20123 Milano

Page 3: scarica quaderno

1

Valutazione e modelli interpretativi di customer satisfaction:

una presentazione di insieme1

Angelo Zanella

Istituto di Statistica – Università Cattolica del S. Cuore, Milano

1. INTRODUZIONE - SOMMARIO

Gli studi di customer satisfaction, concernenti, cioè, il soddisfacimento del cliente o consuma-tore o utilizzatore di un prodotto/servizio, si sono inizialmente sviluppati, sia dal punto di vista pratico che teorico, nell’ambito del Marketing. La conoscenza e l’interpretazione sistematica di come i consumatori percepiscono e valuta-no la qualità dei prodotti/servizi si è subito delineata essenziale per l’orientamento della ge-stione e delle strategie d’impresa. Di conseguenza la disponibilità di misure e di modelli in-terpretativi di customer satisfaction, collegati alle valutazioni soggettive della qualità dei pro-dotti/servizi, sta divenendo tanto importante quanto le corrispondenti misure tecnologiche oggettive, e, quindi, un elemento rilevante del controllo statistico di un Sistema Qualità, si veda, ad esempio, Zanella (2000). Più in generale il soddisfacimento del consumatore – con le relative misure e modelli interpretativi – è una delle componenti essenziali del modello di “gestione aziendale ottima” secondo l’approccio cosiddetto di Total Quality Management, in quanto è alla base del successo economico di un’impresa, si veda Kanji et al. (2000). Gli in-dicatori di customer satisfaction in un intero settore produttivo o addirittura di un sistema pro-duttivo nazionale stanno, poi, acquistando rilevanza per la valutazione delle prestazioni complessive dei sistemi economici, si veda Anderson et al. (2000). I brevi precedenti richiami consentono di trovare una motivazione all’attuale sviluppo, per certi versi frenetico, degli studi rivolti al tema del “soddisfacimento del cliente”, che segnala un allargamento degli ambiti disciplinari coinvolti, che ora includono, oltre al Marketing, l’Economia aziendale in modo allargato, la Sociologia, l’Economia, e, più decisamente, la Statistica. Sembra, pertanto, giunto il momento in cui risulti utile fare il punto circa i mol-teplici contributi e le proposte disponibili sul tema in esame, con riferimento ai diversi set-tori disciplinari. Il presente contributo si muove, appunto, in questa direzione con riferimento a quanto la metodologia statistica ha dato, e potrà ancora dare, allo sviluppo ed alla chiarificazione delle problematiche collegate alla “misurazione” ed ai “modelli interpretativi” di “customer satis-faction”, che stabiliscono il nucleo metodologico quantitativo fondamentale per 1 Il testo corrisponde al contenuto del seminario «Valutazione e modelli interpretativi di “customer satisfac-tion”: conclusioni e prospettive», tenuto dall’autore a conclusione del corso “Metodi statistici per la misura-zione della Customer Satisfaction” organizzato dalla Società Italiana di Statistica (SIS) e svoltosi a Roma dal 26 febbraio al 2 marzo 2001 (ripetuto a Napoli dal 9 al 13 luglio). Maggiori dettagli possono trovarsi nella corrispondente “dispensa” distribuita ai partecipanti del corso che, disponibile presso la SIS, può, comun-que, essere richiesta all’autore.

Page 4: scarica quaderno

2

l’utilizzazione concreta della nozione anzidetta nei fenomeni di marketing, di gestione a-ziendale, di un sistema economico nazionale, ecc.. Conviene anche segnalare che nella letteratura sul “soddisfacimento del cliente” il discorso verte quasi esclusivamente sulla qualità come è valutata da “singoli” o “piccoli” consumato-ri di beni o servizi – diciamo che il riferimento è il consumo famigliare, mentre viene prati-camente ignorato il “grande cliente” – tipicamente costituito da un’azienda – interessato a grandi forniture ripetute nel tempo, si veda la discussione e la differenziazione al riguardo date in Vedaldi (1997). Il presente contributo si riferisce essenzialmente al contesto dei “piccoli consumatori” ed è articolato nei seguenti punti.

Nel § 2, Il costrutto concettuale, si richiama la metodologia che consente di associare ad un concetto, attinente a manifestazioni fenomeniche, un “costrutto concettuale” e dei processi di misurazione atti a collegarlo, tramite variabili latenti, con variabili osservabili o “manife-ste” o indicatori.

Nel § 3, Il problema delle scale ordinali, si ricordano le limitazioni all’elaborazione statistica di indicatori di customer satisfaction poste dai dati – tipicamente ottenuti dalle risposte a questio-nari – quando essi sono espressi come punteggi convenzionali e, quindi, devono interpre-tarsi come modalità di caratteri solo ordinati. Vengono al riguardo richiamate alcune tecni-che che consentono di attenuare l’inconveniente, in particolare quella basata sull’approccio “psicometrico” di Thurstone.

Nel § 4, Modelli diretti formativi o compositivi, si considera il metodo fondato sulla definizione diretta della misura di “customer satisfaction globale”, come media ponderata di indicatori di “customer satisfaction marginali”, attinenti a “dimensioni specifiche” del prodotto/servizio (si considera, in particolare, il SERVQUAL).

Nel § 5, Modelli diretti esplicativi o decompositivi, si considera il metodo – fondato sulla rileva-zione diretta della misura di “customer satisfaction globale” tramite una scala di punteggi con-venzionale – che formula un’ipotesi sul sottostante costrutto concettuale attraverso il colle-gamento, mediante un modello di regressione, dei precedenti punteggi con indicatori relati-vi a “dimensioni specifiche o marginali”, sia del prodotto/servizio che dell’unità statistica (soggetto). Si considera: a) il caso di un modello di regressione, sia applicato a variabili indi-catrici che a loro trasformazioni secondo la metodologia della “regressione monotona” di Kruskal; b) l’approccio della regressione logistica, in cui la risposta è la probabilità di soddi-sfacimento globale, condizionata da specifici valori delle variabili descrittive del costrutto sottostante; c) si collega il modello di Rasch al precedente contesto.

Nel § 6, Modelli strutturali, si constata come mediante tali modelli si possa rendere rigoroso il procedimento di definizione del concetto di customer satisfaction attraverso l’associazione del-lo stesso con altri aspetti del fenomeno di acquisto e valutazione di un bene o servizio, fino ad “incapsularlo” in un costrutto concettuale del tipo causa-effetto, che è, poi, collegato a variabili manifeste tramite pertinenti processi di misurazione. Si sottolinea, però, l’aspetto problematico insito nell’utilizzazione, per formulare il modello del costrutto concettuale, di variabili latenti, cioè, non direttamente osservabili, per i valori delle quali dovranno ottener-

Page 5: scarica quaderno

3

si delle stime a partire dalle corrispondenti variabili manifeste. Si ricorda che ciò è attuato, unitamente alla stima dei parametri del modello, dal metodo di Wold, cosiddetto del Partial Least Squares (PLS), ciò che ne spiega la larga diffusione. Si fa presente come il ricorso ai modelli strutturali, in particolare dopo l’utilizzazione sistematica che se ne sta facendo per la definizione degli indici nazionali, sembra costituire la metodologia più rigorosa attual-mente disponibile per le valutazioni di customer satisfaction. Ci si chiede se per le applicazioni correnti non sia possibile utilizzare tecniche di analisi dei dati, concettualmente più sempli-ci, per ottenere indicazioni simili.

Nel § 7, Modelli di reti bayesiane, si mostra come tali modelli – basati su grafi orientati aciclici e riferiti a variabili manifeste, fra le quali una attinente alla customer satisfaction globale, tipi-camente misurata su una scala di punteggi convenzionale – possano servire al fine di stabili-re per quest’ultima un costrutto concettuale di causalità. Ciò è ottenuto dall’esame “siste-matico” della verosimiglianza dei dati osservati nei nodi della rete, ciascuna condizionata-mente alla configurazione di uno o più nodi antecedenti. Il metodo sembra particolarmente appropriato al caso di variabili manifeste di tipo qualitativo.

Il § 8, infine, contiene le Conclusioni, in cui si sottolinea, in particolare: a) l’opportunità di ul-teriori ricerche di base rivolte a stabilire dei costrutti concettuali “ben fondati”, se possibile anche per classi di “beni durevoli” in aggiunta a quanto è già disponibile per i servizi; b) la necessità di ulteriori approfondimenti al riguardo delle scale di punteggio convenzionali e delle eventuali corrispondenti trasformazioni, unitamente allo studio della robustezza nei loro confronti dei metodi statistici correntemente utilizzati; c) l’opportunità di un confron-to sistematico in casi reali dei vari modelli esaminati, in particolare dell’applicazione alterna-tiva dei modelli strutturali lineari a variabili latenti e delle reti bayesiane.

2. IL COSTRUTTO CONCETTUALE ED IL PROCESSO DI MISURAZIONE

Si seguirà la metodologia indicata da Bollen (1989), p. 179 e seg., integrata dall’ottima sinte-si di Evrard (1992) e dalle puntualizzazioni critiche date in Brasini et al. (1999), § 2 e in Manaresi et al. (2000), § 1,2,3. Quando si vuole associare ad un concetto – inteso come “tratto unificante” un insieme di manifestazioni fenomeniche – un costrutto concettuale ed un corrispondente processo di misura-zione si può adottare il procedimento riassunto nei punti seguenti. 1. Ricerca di un’accurata definizione verbale del concetto.

Ad esempio la definizione di customer satisfaction data da Hunt (1977) si riferisce ad un bene o servizio dopo l’acquisto ed afferma “The evaluation rendered that the experience was at least as good as it was supposed to be”.

2. Individuazione degli aspetti essenziali, dimensioni, delle manifestazioni fenomeniche in studio colle-gati al concetto di interesse. Anche detti aspetti sono tipicamente di natura concettuale. Si giunge ad una “rete” di concetti in cui è “incapsulato” quello in studio e, globalmente, al cosiddetto costrutto con-cettuale. Ciò può farsi, in primo luogo, attraverso l’analisi semantica della definizione del

Page 6: scarica quaderno

4

concetto di interesse. Ad esempio la precedente definizione di Hunt include un con-fronto cui corrispondono due dimensioni collegate rispettivamente alla percezione del prodotto/servizio acquistato e che stanno alla “base di riferimento iniziale”, anteriore all’acquisto. I successivi approfondimenti hanno portato al corrispondente costrutto della “discre-panza” con insiemi, tipicamente speculari, di dimensioni attinenti a: • prestazioni percepite • prestazioni attese, collegate in modo specifico al prodotto/servizio in esame e tali che dal loro confronto originano le • discrepanze, che determinano la customer satisfaction. Questo “paradigma” della discrepanza o gap è stato sviluppato sistematicamente su base sperimentale da Parasuraman, Zeithaml e Berry a partire dal loro fondamentale lavoro del (1988), che si riferisce ai servizi ed è all’origine del noto procedimento SERVQUAL. L’essenzialità della dimensione “discrepanza” non è condivisa, da tutti gli autori in quanto riscontri sperimentali mostrano come la dimensione “prestazioni attese” possa risultare ridondante in quanto già “assorbita” da quella “prestazioni percepite”, si veda Cronin et al. (1992) e Manaresi et al. (2000), § 2. Altre indagini hanno portato ad aggiungere le dimensioni: • “costo” percepito, in relazione alle prestazioni percepite ed attese (valore) • motivi per esplicite lagnanze • fedeltà del cliente. La precedente rete di dimensioni ed il corrispondente costrutto, rappresentato nel se-guito per chiarezza nella Fig. 1, sono quelli alla base dell’American Customer Satisfac-tion Index (ACSI), si veda ad esempio Anderson e Fornell (2000). Non molto diverso si presenta il costrutto utilizzato nella definizione dell’European Customer Satisfaction Index (ECSI), si veda ad esempio Cassel et al. (2000), nel quale non figura la dimensio-ne “motivi di esplicite lagnanze”, ma è aggiunta la dimensione “desideri” (image), pure suggerita da alcuni autori, si veda Brasini et al. (1999).

3. Definizione di un procedimento di misurazione a partire dalla scelta, per ogni dimensione, di uno o più corrispondenti indicatori o variabili osservabili o manifeste. Quando si considerano più indicatori Xi per una stessa dimensione si è soliti associare a quest’ultima un’unica “variabile latente non osservabile” ξ secondo un modello, cosid-detto di misurazione, del tipo:

Xi = ξ + δi , i = 1, 2, …, q, (2.1)

dove ξ è una variabile casuale con varianza finita, non correlata con le variabili casuali δi di media nulla e varianze pure finite. Ad esempio nella costruzione dell’indice ACSI alla

Page 7: scarica quaderno

5

Figura 1 Schema del costrutto concettuale alla base dell’ American Customer Satisfaction Index

variabile latente ξ : aspettative del cliente, si fanno corrispondere tre variabili manifeste osservate su scale convenzionali. X1 : aspettativa del cliente nei confronti della qualità complessiva; X2 : aspettativa del cliente nei confronti dell’affidabilità del prodotto; X3 : aspettativa del cliente circa un trattamento personalizzato; si veda Anderson et al. (2000). Un tipico indice utilizzato per stabilire l’attendibilità di un insieme di indicatori Xi è la stima campionaria del coefficiente α di Cronbach, definito come il quadrato del coeffi-

ciente di correlazione fra ξ ed H = ∑ qi=1 Xi . Si dimostra che:

α =

q

q − 1

1 − ∑ i Var(Xi)

Var(H) (2.2)

ed α assume il valore 1 se Xi ≡ ξ, ∀i, si veda Bollen, p. 216. Più in generale può adottarsi un modello di misurazione complessivo, attinente o a tutte le variabili latenti associate alle dimensioni del costrutto, o a un loro sottoinsieme, come ad esempio quello delle variabili latenti esogene, cioè tali che in accordo al costrutto non figura fra le stesse un nesso causale. Precisamente si può assumere il modello:

Xji = λji ξj + δji, i = 1, 2, …, qj, j = 1, 2, …, p, (2.3)

dove λji sono incognite costanti, ξj descrivono le variabili latenti associate alle p dimen-sioni del costrutto, δji sono “componenti di errore”, le ξj si intendono essere variabili casuali, con matrice di covarianza Φ con elementi finiti, non correlate con le variabili casuali δji , ∀ j, i di media nulla e tutte fra loro non correlate. Il precedente modello – si

Prestazioni attese

Valore

Prestazioni percepite

ACSI

Lagnanze

Fedeltà

Page 8: scarica quaderno

6

veda Bollen (1989), p. 247 per le condizioni di identificabilità parametrica – consente mediante le tecniche di analisi dei fattori di confermare o eventualmente modificare il numero ed il significato delle dimensioni e/o dei corrispondenti modelli di misurazione introdotti nel costrutto. Si ha, cioè, in genere, un procedimento di aggiustamento itera-tivo: si veda al riguardo l’esemplare illustrazione dell’analisi preliminare anzidetta data in Parasuraman et al. (1988), ed anche Manaresi et al. (2000), p. 305. Il disporre di adeguati processi di misurazione è premessa indispensabile per dare carat-tere sperimentale al modello matematico del costrutto concettuale inclusivo della cus-tomer satisfaction e consentire, quindi, la sua validazione e l’ottenimento di stime dei corrispondenti valori di customer satisfaction. Allo sviluppo di questi argomenti è rivol-ta gran parte dell’esposizione seguente. Si è voluta richiamare nei suoi tre aspetti la metodologia richiesta per stabilire un co-strutto concettuale – in particolare, quindi, quello relativo alla customer satisfaction – fra i quali è essenziale il procedimento di misurazione, che solo gli dà significato speri-mentale, dato che talvolta nelle applicazioni detti elementi sembrano assunti come noti su base intuitiva e superficiale. Al riguardo sarebbe molto interessante un contributo che presentasse in modo organico il materiale sperimentale che giustifica i correnti co-strutti concettuali di customer satisfaction, quali, ad esempio, quelli alla base degli indici ACSI ed ECSI.

3. IL PROBLEMA DELLE SCALE ORDINALI

3.1 Qualche riflessione preliminare

I processi di misurazione si basano su variabili manifeste, cioè, corrispondenti a caratteri o aspetti osservabili del fenomeno in studio. Per ciascuna variabile manifesta deve essere, quindi, definita una “scala di misurazione” che consente di descrivere le modalità del carat-tere cui la variabile è associata. Esce dai limiti di questa sintesi un commento appropriato della complessa teoria logico-matematica sviluppatasi in tempi recenti al riguardo della co-struzione di scale di misurazione, in particolare per tenere conto delle esigenze delle scienze del comportamento, si veda Franceschini (2001). Ci si limita, pertanto, a qualche osserva-zione sulle scale ordinali numeriche, che si ritiene abbia interesse concreto nel contesto in esame. Il ricorso ad una scala ordinale numerica è, infatti, molto frequente nelle indagini di marketing e, quindi, in particolare, negli studi di customer satisfaction, per “codificare”, in accordo ad un insieme ordinato di categorie, mediante l’assegnazione di un valore numerico la risposta di un soggetto agli stimoli provenienti da un aspetto di interesse in un prodotto o servizio. Per rendere più chiaro quanto segue si consideri, ad esempio, uno “sportello” di una de-terminata sede bancaria e l’insieme di N successive operazioni correnti: versamenti, prelievi, bonifici, ecc. espletate in un certo periodo di tempo. Si suppone di chiedere ad un “sogget-to”, dopo che abbia fruito del servizio, di qualificarne l’attuazione scegliendo una voce nella scala verbale, semantico-differenziale, stabilita dalle seguenti affermazioni:

Page 9: scarica quaderno

7

estremamenteinefficiente inefficiente normale efficiente

estremamenteefficiente

Concettualmente si può ritenere che la regola anzidetta stabilisca per l’insieme di elementi considerato un sistema relazionale empirico. Secondo la teoria assiomatica, attinente alla costruzione di scale di misurazione, una scala ordinale nel campo reale, cioè numerica, può ottenersi nelle condizioni e secondo le modalità sotto riportate (si veda ad esempio Tho-mas, 1986). In primo luogo il sistema relazionale empirico deve potersi ricondurre allo schema seguen-te. Sia A un insieme finito di elementi, tipicamente non numerici, per il quale è assegnata una relazione binaria ϕ fra le coppie di elementi (se a1, a2 ∈ A, a1 ϕ a2 si legge “a1 è in rela-zione con a2”), quindi, definita nell’insieme A × A; ϕ soddisfi, inoltre, le condizioni seguenti: ∀ a, b, c ∈ A: 1) riflessività (identificabilità): a ϕ a 2) concatenamento: a ϕ b ovvero b ϕ a 3) transitività: se a ϕ b e b ϕ c allora a ϕ c . Nell’esempio precedente l’insieme A è costituito dalle N operazioni bancarie considerate e la relazione ϕ risulta definita ammettendo che ogni soggetto sia in grado di identificare cia-scuna operazione (elemento), anche se dello stesso tipo, e, per ogni coppia, di stabilire se le operazioni sono state svolte in modo egualmente efficiente ovvero una in modo più effi-ciente rispetto all’altra (relazione di “almeno altrettanto efficiente”); inoltre la qualificazione sia coerente, cosicché sia garantita la condizione 3), nel senso che, se l’operazione a è svolta in modo almeno altrettanto efficiente rispetto a b, l’operazione b in modo almeno altrettan-to efficiente rispetto a c, l’operazione a è almeno altrettanto efficiente di c. Sotto le precedenti condizioni si dimostra il seguente teorema, che stabilisce la rappresen-tabilità degli elementi di A e delle rispettive relazioni nel campo reale.

“Esiste una funzione f : A → ℜ tale che: a ϕ b se e solo se f (a) ≥ f (b); (3.1) la funzione f non è unica nel senso che la (3.1) è garantita da una qualsiasi altra funzione reale h[f(x)], x ∈ ℜ, con h(⋅) funzione strettamente monotòna crescente”

Si è in tale modo definito un procedimento di misurazione e si dice che gli elementi di A, con la struttura di relazioni che li caratterizza, sono rappresentati attraverso le misurazioni f (a), a ∈ A, su una scala ordinale. Mediante la scala ordinale definita come si è detto possono classificarsi gli N elementi “ma-teriali” dell’insieme A. Nell’esempio precedente A è costituito dall’insieme di operazioni bancarie considerato: la classificazione dipende ovviamente dal soggetto valutatore che, ri-tenuto unico, ha in sostanza, la funzione di “unico strumento di misura”. Se, però, conside-riamo le valutazioni di M diversi soggetti, e questi, come è ragionevole, non possono rite-nersi “identici”, diventa in generale impossibile ammettere l’esistenza di un sistema relazio-nale empirico fra gli elementi materiali di A con le proprietà sopra specificate, che sono ne-cessarie per giungere ad una scala ordinale. Si noti, infatti, per fissare le idee, che date due

Page 10: scarica quaderno

8

operazioni bancarie a1, a2 un soggetto può ritenere a1 svolta in modo più efficiente di a2 , un secondo il viceversa, ecc.. In questo caso può avere senso considerare come manifestazioni fenomeniche l’insieme A* delle M × N possibili valutazioni da parte degli M soggetti, intro-durre tra le coppie delle stesse la relazione “se a1, a2 ∈ A*, o a1, a2 sono valutazioni della stessa classe, ovvero una cade nella classe successiva” e giungere, secondo le assunzioni ed i risultati teorici visti prima, ad una scala ordinale per le valutazioni. Evidentemente questa scala ordinale non fa diretto riferimento agli elementi materiali o “oggettivi”, dell’insieme A, costituito dalle operazioni bancarie nell’esempio in discussione: ordina le valutazioni non gli oggetti. Più soggetti possono, invece, venire considerati senza difficoltà quando si tratta di valutare una sola unità sperimentale, o più unità da considerarsi identiche, come è tipico nelle inchieste, tramite questionario, su un unico prodotto fabbricato in serie. In questo caso, infatti, ha interesse classificare l’insieme delle valutazioni dei diversi soggetti. Si noti che i risultati ottenuti sono in questo caso simili concettualmente a quelli utilizzati in ambito tecnologico per stabilire la “riproducibilità” di un procedimento di misura al variare del solo strumento, che si identifica col soggetto, nel contesto in esame. Quanto precede sembra giustificare la notevole cautela nel fare riferimento a più soggetti che caratterizza gli utilizzatori della tecnica cosiddetta di conjoint analysis. Quest’ultima, infat-ti, si basa su una scala ordinale utilizzata per classificare gli elementi di un insieme di unità sperimentali, corrispondenti a prodotti o servizi diversi per costruzione, con riferimento al-le loro caratteristiche “oggettive”. Nel precedente ordine di idee esaminiamo il modello, che si ritiene corrente, posto alla base della conjoint analysis, cosiddetta non metrica, pensando di utilizzare le valutazioni di N og-getti (prodotti, servizi) ritenuti diversi, da parte di M giudici. Si consideri, per semplicità, il caso in cui si voglia studiare la dipendenza degli oggetti in studio da due fattori di tipo qua-litativo, o trattati come tali, con I e K livelli rispettivamente e sia N = IK, cioè, si assuma un piano sperimentale fattoriale completo. In assenza di interazioni, in termini descrittivi e semplificati, il modello può ritenersi il seguente, quando yi

(km), i = 1, 2, …, I; k = 1, 2, …, K ;

m = 1, 2, …, M indichino le valutazioni espresse da ciascun giudice su una propria scala or-dinale:

fm (yi(km)) = µ(m) + α1

(,m

i) + α2

(,m

k) + εi

(km) (3.2)

dove ∑ Ii=1 α1(,m

i) = ∑ Kk=1 α2

(,m

k) = 0, µ(m) , α1

(,m

i) , α2

(,m

k) rappresentano delle quantità latenti rite-

nute espresse, per ogni determinato valore, su una propria scala ad intervalli, che descrivo-no il “livello medio” e gli effetti dei due fattori; εi

(km) è una componente d’errore; fm(⋅) è una

funzione monotòna crescente, di cui si ammette per ipotesi l’esistenza, tale da ricondurre i valori yi

(km), rappresentati su una scala ordinale, ad una scala ad intervalli coerente con il mo-

dello. In concreto fm(⋅) è, per ogni determinato valore m , ottenuta dai dati ordinali yi(km), uni-

tamente ai parametri incogniti, in particolare α1(,m

i) , α2

(,m

k) , che esprimono le cosiddette utili-

tà, in modo che sia il migliore possibile l’accostamento fra i dati ordinali trasformati, al primo membro della (3.2), ed il modello al secondo membro, (tipicamente è utilizzata una

Page 11: scarica quaderno

9

forma conveniente del criterio dei minimi quadrati: si veda ad esempio Zanella et al., 2000, che porta alla cosiddetta “regressione monotòna” di Kruskal ed i cenni nel seguente § 5). Le precedenti considerazioni di qualche dettaglio sono rivolte a rendere evidente ed a sot-tolineare che ciascun giudice ha associata una propria scala e ciò rimane vero anche quando

si passa ai dati trasformati fm (yi(km)) ed alle corrispondenti stime α1

(,m

i) , α2

(,m

k) delle utilità. Sen-

za particolari ipotesi aggiuntive che vanno specificate, ad esempio che siano identiche per i diversi giudici le scale ad intervalli caratterizzanti i dati trasformati, non ha, quindi, a rigore, senso considerare ad esempio le medie aritmetiche dei valori di utilità trovate per i diversi giudici, ma anche la loro mediana, ecc.. Come si farà presente anche nel seguito una diffi-coltà che contraddistingue le ipotesi concernenti variabili latenti è che risulta talvolta prati-camente impossibile verificarne, sia pure in modo indiretto, la validità sperimentale.

3.2 Trasformazioni per ottenere scale metriche

Col ricorso alla nozione di variabile latente e ad un corrispondente modello probabilistico è possibile trasformare – sulla base di convenienti ipotesi – i valori di una scala ordinale in altri espressi su una scala metrica, tipicamente ad intervalli. Seguendo Zanella et al. (2000) si supponga di poter idealizzare la legge secondo cui si mani-festa il risultato osservato da un’unità sperimentale – costituita, ad esempio, dal rispondente ad un questionario – mediante una variabile aleatoria categorica multidimensionale X = (X1, X2, …, XK)′ con componenti che assumono, per semplicità, uno stesso numero I* = I + 1 di modalità qualitative ordinate xki , i = 1, 2, …, I*, k = 1, 2, …, K, che possono sempre rap-presentarsi su una scala ordinale mediante i valori xki = i, i ∈ {1, 2, …, I*} = S.

Sia P(Xki = i) = pki la probabilità, marginale, ∑ i pki = 1, ∀k, che la componente k-ma di X assuma il valore i e si indichi con: Fk(i) = ∑

{i ∈ S, j ≤ i} pkj (3.3)

la probabilità che si verifichi una o l’altra delle prime i modalità. Si consideri l’approccio psicometrico di Thurstone, proposto originariamente nell’ambito dello studio delle valuta-zioni soggettive conseguenti agli stimoli provenienti da un oggetto e con riferimento alla di-stribuzione normale. Si supponga precisamente che alla variabile categorica X corrisponda ordinatamente una variabile casuale multidimensionale di tipo continuo Z = (Z1, Z2, …, ZK)′ non direttamente osservabile o latente – le cui componenti, quindi, assumono per ipo-tesi valori su scale metriche, tipicamente ad intervalli – collegata con la variabile categorica manifesta X secondo le condizioni sotto specificate. Si ammetta che:

Ψk

ξki − µk

σk;αk = Fk(i) , k = 1, 2, …, K, (3.4)

dove Ψk(⋅) indica la funzione di ripartizione marginale della generica componente Zk di Z, µk, σk > 0 sono, rispettivamente, i relativi parametri di posizione e di scala , αk è la generica componente di un vettore α riassuntivo di tali parametri. Nel caso di distribuzioni normali

Page 12: scarica quaderno

10

µk, σk divengono rispettivamente la media aritmetica e lo scarto quadratico medio e non e-siste α. Abbastanza corrente, si veda ad esempio Bollen (1989), p. 438 e seg., è l’utilizzazione della (3.4) nel caso in cui la variabile Z sia normale multivariata, quindi, con distribuzioni margi-nali delle componenti pure di tipo normale. Se Φ(⋅) indica la funzione di ripartizione della variabile casuale normale standardizzata si ottiene, infatti, la trasformazione di scala deside-rata, ponendo: (ξki − µk)/σk = ζki = Φ−1[Fk(i)] , i = 1, 2, …, I, (3.5)

dove Φ−1(⋅) è la funzione inversa di Φ(⋅). La trasformazione (3.5) consente, ∀k, di sostitui-re ai valori originari xki = i, i = 1, 2, …, I, attinenti ad una scala per ipotesi solo ordinale, i valori ξki espressi sulla scala ad intervalli – definita, si ricordi, a meno di un cambiamento arbitrario di origine e di scala – della corrispondente variabile latente; ad i = I + 1 = I* si fa corrispondere il valore + ∞. In concreto le probabilità marginali pki , necessarie per il calco-lo della (3.3), saranno sostituite dalle corrispondenti stime consistenti pki = Nki / N, i = 1, 2,

…, I, ∑ i Nki / N = 1, ∀k, ottenute in un campione casuale semplice di N osservazioni da X. Il metodo precedente è stato anche sviluppato, nel caso di una variabile normale doppia e con riferimento alle probabilità congiunte nelle classi, per ottenere congiuntamente, secon-do il criterio della massima verosimiglianza, le stime degli estremi delle classi, diciamo ξ1i , ξ2i , i = 1, 2, …, I, oltre a quella del coefficiente di correlazione fra le componenti della va-riabile latente doppia. I corrispondenti risultati sono utilizzati, ad esempio, nell’analisi dei modelli strutturali a variabili latenti (modelli LISREL) per ricondurre nell’ambito di scale metriche e, quindi, al coefficiente di correlazione, in accordo alle esigenze formali del mo-dello LISREL, l’espressione della dipendenza fra coppie di variabili manifeste solo ordinali, si veda Bollen (1989), pp. 441 e seg., Muthèn (1984) e Jöreskog (1994). La critica che può rivolgersi all’utilizzazione di una tecnica di cambiamento di scala del tipo espresso dalla (3.5), o alla sua estensione bivariata, è che non risulta agevole la verifica delle assunzioni su cui si fonda. Ad esempio per i modelli LISREL si dovrebbe accertare che la struttura di covarianze alla base del modello è meglio spiegata ipotizzando per le variabili manifeste, solo ordinali, l’esistenza di corrispondenti variabili latenti di tipo normale ed uti-lizzando trasformazioni del tipo (3.5), che non ritenendo convenzionalmente le scale ordi-nali già di tipo metrico. Si tratta di una verifica piuttosto indiretta. Vi sono situazioni, però, nelle quali una verifica diretta della validità delle trasformazioni (3.5) risulta possibile. Questo in base ad un’estensione abbastanza trascurata in letteratura, che si ritiene sia stata presentata in termini formali espliciti per la prima volta in Zanella et al. (2000) e viene presentata brevemente nel seguito in termini generali. Si supponga che alle modalità ordinate xki ∈ {1, 2, …, I} delle variabili categoriche Xk , k = 1, 2, …, K, per ciascuna delle variabili casuali latenti Zk, corrisponda uno stesso insieme ordinato di valori zki = ξi , ∀k, ξi < ξi+1, i = 1, 2, …, I − 1. Si abbia, quindi, in corrispon-denza alla (3.4), dove ora ξki = ξi , ∀k:

Page 13: scarica quaderno

11

ξi − µk

σk = ζki(αk) (3.6)

i = 1, 2, …, I, k = 1, 2, …, K. Si ponga ζ−i = ∑ Kk=1ζki / K, sia, cioè, ζ−i la media aritmetica dei quantili delle K variabili latenti che corrispondono alla stessa categoria i per tutte le variabili osservate. Si può abbastanza agevolmente provare che: 1) i k sistemi lineari:

ζ−i (α) − µ*k

σ*k = ζki (αk), i = 1, 2, …, I, (3.7)

k ∈ {1, 2, …, K}, dove µ*k , σ*k > 0, sono incogniti parametri, ammettono una soluzione

e questa non si riduce a quella banale ζ−i(α) = ζ−(α), ∀i, se e solo se σ− * = ∑ Kk=11/Kσ*k =1,

∑ Kk=1 µ*k /Kσ*k = 0. 2) Qualsiasi struttura latente che soddisfa alla (3.6) è caratterizzata da valori:

ξi = ζ−

i (α) + µ−

σ−

con σ− = ∑ Kk=1 1/Kσk , µ− = ∑ Kk=1 µk /Kσk , vale a dire i valori latenti ξi si ottengono da

quelli ζ−i (α), soddisfacenti la (3.7), per un cambiamento di origine e di scala identico per tutte le K variabili latenti. Si riconduce, in corrispondenza, la (3.6) alla (3.7) pur di pren-dere per le variabili latenti Zk , k = 1, 2, …, K, come nuovi parametri di scala e di posi-

zione rispettivamente σ− σk , (σ− µk − µ− ), ciò che corrisponde alla sostituzione di Zk con

Z*k = σ− Zk − µ− . Poiché le scale delle variabili latenti sono ritenute, in generale, ad inter-valli, dette variabili sono definite a meno di una trasformazione lineare quale è la prece-dente, e si potrà, pertanto, fare riferimento alle variabili Z*k ed ai corrispondenti valori

ζ−i (α) per stabilire l’esistenza o meno della struttura (3.6). In termini operativi, se si dispone di un campione casuale semplice di N elementi da X, sarà possibile ottenere dalle frequenze relative le stime pki delle probabilità marginali pki e, quin-

di, quelle ζ−ki dei quantili ζki. Potranno, quindi, anche calcolarsi le stime µ*k , σ*k , dei parame-tri µ*k , σ*k applicando, ad esempio, il principio dei minimi quadrati all’adattamento delle K rette:

ζ−i = µ*k + σ*k ζki(αk), k = 1, 2, …, K, (3.8)

alle coppie di valori ζ−i , ζ^

ki , i = 1, 2, …, I, controllando, poi, che, oltre all’allineamento, sia-no almeno approssimativamente soddisfatte le condizioni sui parametri specificate sopra in 2). Si potrà cercare anche un miglioramento dell’adattamento variando i parametri αk. Que-sti aspetti della stima e verifica di validità del modello (3.7) sono attuale oggetto di studio dello scrivente; qui interessa soprattutto sottolineare il fatto che la struttura latente (3.6) può essere sottoposta a verifica sperimentale.

Page 14: scarica quaderno

12

Qualche cenno ancora sul carattere generale del procedimento. Nel contesto della customer satisfaction sembra ragionevole considerare famiglie di variabili latenti diverse dalla norma-le che consentono anche di descrivere distribuzioni di probabilità asimmetriche. In Zanella (1998), vedi anche Zanella et al. (2000), si è proposto un modello probabilistico, denomina-to Logistico Weibull-multivariato, ottenuto dalla distribuzione normale multivariata modifi-cando le distribuzioni marginali unidimensionali in modo che siano del tipo Logistico Weibull. Con riferimento a detto modello le (3.4) risultano date dall’espressione:

1 − exp

2

αk log

1 + ζki / σk

1 − ζki / σk αk

= Fk(i) (3.9)

dove αk ≥ 0 sono parametri reali. Per inversione è immediato ottenere dalla (3.9) il rappor-to fra i quantili ζki , i = 1, 2, …, I, ed il parametro di scala σk come:

ζki

σk =

1 − exp { }− αk/2 [ ] − log (1 − Fk(i)) 1/αk

1 + exp { }− αk/2 [ ] − log (1 − Fk(i)) 1/αk ,

k = 1, 2, …, K. In questo caso la (3.8) diviene semplicemente:

ζ−i = σ*k ζki(αk), i = 1, 2, …, I, dato che si sono presi i parametri di posizione identicamente nulli. I parame-tri αk, che consentono di rendere la densità marginale anche fortemente asimmetrica, po-tranno essere utilizzati – variandone i valori – nell’ordine di idee precedenti per migliorare

l’adattamento fra i valori osservati ζ−i , ζki . L’intuizione suggerisce che il tipo di modello sopra discusso in generale potrebbe essere a-datto per descrivere le equazioni di un processo di misura associato ad una variabile latente strutturale con indicatori disponibili solo su scale ordinali. Se per questi ultimi risulta accet-tabile la struttura unificante (3.7), è ragionevole, per semplicità in riferimento alla distribu-zione normale, riformulare un modello di misurazione del tipo indicato nella (2.3), con l’altro:

Z*k − µ*k = λkξ + δk, k = 1, 2, …, K, dove, in accordo a quanto si è visto al riguardo della (3.7), Z*k è la variabile casuale con fun-

zione di ripartizione Φ

Z*k − µ*k

σ*k. λk sono incognite costanti, ξ denota la variabile latente

strutturale, δk le componenti d’errore. Ne segue anche una semplice ipotesi di dipendenza fra le variabili Z*k , poiché risulta Cov(Z*k, Z*k′) = λkλk′σ2

ξ, dove σ2ξ è la varianza di ξ, se si

suppongono, come si è già fatto, le variabili casuali δk anche fra loro incorrelate. Una tale struttura diviene importante nei problemi di stima e verifica di ipotesi al riguardo del mo-dello (3.7). Circa altri approcci al problema delle scale ordinali si è già accennato, considerando la con-joint analysis, a quello di Kruskal, che conduce alla “regressione monotòna” e verrà breve-mente ripreso anche più avanti, § 5. Per una discussione generale del problema del collega-

Page 15: scarica quaderno

13

mento fra variabili osservabili e latenti si veda Barholomew (1983), il cui procedimento “condizionato” porta, in sostanza, nel nostro contesto, al modello di Rasch.

4. MODELLI FORMATIVI O COMPOSITIVI

Caratteristica di questi modelli è la dominanza del carattere di “attributo multidimensiona-le” della “customer satisfaction”, nel quale ciascuna componente corrisponde ad una di-mensione del costrutto concettuale, cioè, ad un aspetto di un prodotto/servizio ritenuto es-senziale nella determinazione della “customer satisfaction”. La sintesi delle valutazioni sui singoli attributi “marginali” ha carattere definitorio e, quindi, convenzionale. Manca, infatti, una ricerca esplicita dei legami funzionali delle variabili latenti, corrispondenti alle varie di-mensioni, con la variabile latente unidimensionale associata al concetto in studio, cioè quel-lo di “customer satisfaction”. Quest’ultima è resa variabile manifesta attribuendole un valo-re ottenuto componendo in modo additivo le valutazioni osservabili in corrispondenza alle di-verse dimensioni: ne segue l’attributo “formativo o compositivo” dato ad un tale modello. Il modello in oggetto è stato sviluppato a partire dal lavoro fondamentale di Parasuraman, Berry e Zeithaml (1988) che sta alla base del notissimo modello SERVQUAL, relativo alla qualità dei servizi. All’articolo anzidetto sono seguite critiche e proposte alternative, si veda ad esempio Babakus et al. (1992) e Cronin et al. (1992), oltre ad estensioni, si veda Teas (1994) e per uno sguardo d’insieme Caldara et al. (1997). Le risposte date punto per punto vigorosamente da Parasuraman, Berry e Zeithaml possono essere seguite nei lavori degli stessi autori del 1991, 1993, 1994. Come anticipato la metodologia fa esplicito riferimento, almeno nelle applicazioni, alla “customer satisfaction” dei servizi. L’articolo di base di Para-suraman et al. (1988) considera una banca, una banca limitata alle carte di credito, un’impresa di manutenzione di apparecchiature, una compagnia telefonica, con l’esame di un campione casuale di 200 clienti contattati direttamente per la somministrazione del que-stionario. Nel lavoro del 1991 gli stessi autori considerano una banca, un istituto di assicu-razione, un’impresa di riparazioni dei telefoni, con campioni, di numerosità da 290 a 487 per le diverse imprese, risultante dalle risposte ad un questionario inviato a più di 1800 clienti scelti a caso da ciascun impresa; Cronin et al. (1992) considerano 2 banche, due a-ziende per il controllo antinquinamento, due lavanderie, due aziende per il fast food con campioni casuali ottenuti, sembra, con contatto diretto dei soggetti di numerosità variabile, per le diverse aziende, da 84 a 98 unità, ecc. Il metodo è però concettualmente estensibile al caso di prodotti materiali, si veda Kristensen et al. (1992). A grandi linee la costruzione del modello in esame può descriversi come indicato nel segui-to. 1. Individuazione delle dimensioni del costrutto e per ogni dimensione delle corrispondenti variabili mani-

feste e relative scale di valutazione. E’ la parte più profonda ed impegnativa della costruzione del modello e se ne è accen-nato al §2, punto 2. Si fonda sull’analisi del costrutto concettuale, nella quale si devono utilizzare i risultati già disponibili in ambito psicologico e psicometrico. Possono, però, essere necessari studi sperimentali specifici. Per la “customer satisfaction” nei servizi è

Page 16: scarica quaderno

14

abbastanza corrente accettare come dimensioni di base le seguenti: aspetto tangibile, affidabi-lità, capacità di risposta, capacità di rassicurazione, empatia (attenzione al cliente). Ciò è conse-guenza di studi sperimentali e di un dibattito svoltosi sistematicamente nel corso degli anni, si vedano i lavori di Parasuraman et al. (1988), (1991), (1994), Babakus et al. (1992), Cronin et al., (1992). Non consta allo scrivente che qualcosa di analogo sia stato realizzato, ad esempio al riguardo dei “beni di largo consumo”. Ad ogni dimensione devono, poi, associarsi più variabili manifeste o indicatori in modo da poter definire un modello di misurazione (almeno due indicatori per ogni dimensione sono necessari in base alle regole per l’identificabilità del modello date ad esempio in Bollen, 1989, p. 247). Ovviamente dette variabili possono almeno in parte essere speci-fiche per il servizio esaminato: diverso è un servizio bancario dal servizio offerto da una segreteria universitaria, ecc.. Siano Xji le variabili manifeste, dove l’indice j = 1, 2, …, J, enumera le dimensioni, l’indice i = 1, 2, …, I, enumera per ogni dimensione i corrispondenti indicatori o varia-bili manifeste. Tipicamente si assume che le variabili Xji siano categoriche ordinate, cia-scuna espressa su una scala semantico-differenziale “ancorata” ad affermazioni estreme – come “del tutto non essenziale”, “ del tutto essenziale”, “dissento fortemente”, “con-cordo fortemente” al riguardo dell’aspetto di una dimensione proposta in un questiona-rio – e tradotta in punteggi. I punteggi ottenuti sulle scale anzidette sono convenzionalmente assunti come espressi su una scala ad intervalli. Nel modello SERVQUAL di Parasuraman et al. (1991) la prima dimensione considerata si riferisce agli aspetti tangibili e per primo aspetto proposto si afferma, al riguardo delle aspettative, con esemplificazione per una compagnia telefonica “eccellente”, “questa a-vrà apparecchiature dall’aspetto moderno”: il rispondente deve esprimere il grado di consenso attraverso la scelta di un valore intero da 1 a 7; al riguardo dell’impresa reale esaminata, si chiede, poi, se questa “ha apparecchiature dall’aspetto moderno” ed il ri-spondente deve indicare la sua valutazione sempre su una scale di interi da 1 a 7, ecc. .

2. Affidabilità degli indicatori. Per ogni dimensione si deve accertare preliminarmente se i corrispondenti indicatori possono effettivamente considerarsi manifestazioni di una stessa variabile latente. E’ uso corrente fare ricorso, ad esempio, al coefficiente α di Cronbach (§2.2) stimato, secondo il metodo dei momenti, per ogni dimensione j me-diante i punteggi Xjih , h = 1, 2, …, N, i = 1, 2, …, I, ottenuti, per i vari indicatori della dimensione j-ma, dagli N intervistati. Il coefficiente α di Cronbach (2.2) vale, in effetti, per modelli di misurazione del tipo (2.1), si veda Bollen p. 215. Più realistico è, però, il modello (2.3), per il quale non tutti gli indicatori di una stessa variabile latente sono misurati nella stessa scala di quest’ultima. In tale caso il coefficiente α di Cronbach rappresenta solo un limite infe-riore della misura di affidabilità, come è definita al riguardo della (2.2). Sono considerati validi, in senso descrittivo, valori α ≥ 0.7, si veda Manaresi et al. (2000), p. 305; per la scala SERVQUAL riveduta si indicano valori tutti maggiori di 0.8, si veda Parasuraman

Page 17: scarica quaderno

15

et al. (1991), p. 423. Come si è accennato alla fine del precedente paragrafo sarà interessante anche accertare se sussiste una struttura latente del tipo (3.6), cosicché si possa sostituire la scala di pun-teggio convenzionale con una metrica.

3. Analisi dei fattori per la conferma complessiva dei procedimenti di misurazione. L’obiettivo finale è quello di giungere a confermare le dimensioni del costrutto concettuale con i corrispon-denti procedimenti di misurazione, vale a dire la validità di un modello del tipo (2.3), che sotto viene ripresentato per chiarezza con notazioni matriciali:

X =

X11

MX1q1

MXj1

MXjqj

MXp1

MXpqp

=

λ11 0 L 0

λ1q1 0 L 0

M M M M

0 0 L λj1

0 0 L λjqj

M M M M

0 0 L 01

0 0 L 0j

01 L 0

0j L 0

M M M

0 L 01

0 L 0j

M M M

0 L λp1

0 L λpqp

ξ1

Mξj

Mξp

+

δ11

Mδ1q1

Mδj1

Mδjqj

Mδp1

Mδpqp

=

= ΛX ξ + δ, (4.1)

dove X indica il vettore delle variabili aleatorie manifeste, ξ il vettore delle variabili la-tenti (fattori) associate alle p dimensioni del costrutto; ΛX è la matrice, di dimensioni

q × p, se q = ∑ j qj , dei “pesi” delle variabili manifeste sui corrispondenti fattori, ed il vettore δ, q × 1, riassume le componenti d’errore. Le assunzioni sono E(ξ) = 0, E(δ) = 0, Cov(ξ,δ) = E(ξδ′) = 0, se E(⋅) indica la media rispetto alle sottostanti distri-buzioni di probabilità. Si devono, quindi, determinare, in base ai risultati campionari, gli incogniti parametri che caratterizzano la struttura di covarianza:

ΣX = E(XX′) = ΛX ΦΛ′X + Ψ, (4.2)

dove Φ = E(ξξ′) è la matrice di covarianza delle variabili latenti, Ψ = E(δδ′) quella delle componenti d’errore che tipicamente si suppone diagonale, ad esprimere il fatto che si assumono errori incorrelati. L’inferenza statistica sul modello (4.2) è, come noto, l’oggetto di quell’ampio capitolo di teoria statistica noto come analisi dei fattori e si fa rinvio al riguardo, ad esempio, al classico testo di Johnson e Wichern (1992), Cap. 9, per i lineamenti teorici generali, ed a Bollen (1989), in particolare al Cap. 7, dedicato ai mo-delli di misurazione, cioè del tipo descritto dalla (4.1). E’ corrente particolarizzare la struttura (4.2) assumendo inizialmente i fattori ξi incorrelati e di varianza unitaria – mo-dello ortogonale – cosicché Φ = Ip, essendo Ip la matrice identità.

Page 18: scarica quaderno

16

La (4.2) rimane in tale caso invariata se il vettore ξ è sostituito con l’altro ξ* = Mξ con M matrice p × p non singolare ed in corrispondenza ΛX con ΛX M−1. Ciò consente, da un punto di vista geometrico, di cambiare il sistema di riferimento rispetto al quale sono rappresentate le variabili ξ – le cosiddette “rotazioni”, che, in generale, portano a nuovi assi “obliqui” – e di scegliere i fattori in modo “il più possibile coerente” con il modello ipotizzato; la rotazione obliqua introduce, evidentemente, la possibilità di descrivere re-lazioni di dipendenza fra le variabili latenti ξ*j . La tecnica precedente è quella che è stata utilizzata per mettere a punto il modello SERVQUAL, si veda Parasuraman et al. (1988), (1991). Si noti infine che, come si è già anticipato commentando la (2.3) al §2, la conferma di un modello del tipo (3.10) rappresenta, in generale, la fase conclusiva di un procedimento esplorativo iniziale che può condurre alla rimozione o all’aggiunta di dimen-sioni e/o di corrispondenti variabili manifeste. In questa fase esplorativa si utilizzerà un modello nel quale non si hanno “a priori” elementi nulli nella matrice ΛX ed anche il numero di dimensioni p può esser maggior di quello ammesso nell’analisi conclusiva del costrutto concettuale, si vedano ancora i lavori Parasuraman et al. (1988), (1991). Il grado di adattamento complessivo del modello ai dati può esser valutato mediante va-ri indici di bontà di adattamento, si veda Manaresi et al. (2000), p. 306 per una rapida sintesi. Nell’ipotesi di multinormalità delle osservazioni e di stime ottenute secondo il criterio della massima verosimiglianza è disponibile al riguardo il consueto test asintoti-co del rapporto delle massime verosimiglianze basato su una variabile χ2, si veda ad e-sempio Johnson e Wichern (1992), p. 417; possono, sotto le precedenti ipotesi, anche

ottenersi stime degli scarti quadratici medi asintotici degli stimatori λji dei parametri λji ecc., si veda Bollen (1989), pp. 286 e seg. .

4. Definizione di un indicatore riassuntivo delle valutazioni attinenti alle diverse dimensioni: “customer satisfaction” o qualità del servizio? Entrano in gioco a questo livello le “interpretazioni ulti-me” del concetto di “customer satisfaction”. Possono al riguardo dell’utilizzazione reale del modello in esame ritenersi dominanti due paradigmi. a) Il paradigma della “discrepanza o gap”: il soddisfacimento sorge da un confronto fra per-

cezioni (P) ed aspettative (A) SERVQUAL. E’ in sostanza il paradigma alla base del SERVQUAL sostenuto efficacemente, come si è già detto, da Parasuraman, Berry e Zeithaml in numerosi scritti. Si fonda sul risultato psicometrico teorico, ritenuto ben consolidato, che le valutazioni di un consumatore in conseguenza degli stimoli pro-venienti da un prodotto/servizio, siano ottenute dal confronto con una “norma”. Nella revisione della scala originaria del SERVQUAL la norma costituita dalle aspet-tative collegate ad un prodotto ideale in assoluto (I) è stata sostituita con le aspettati-ve suggerite da un’impresa del settore considerato che offre prestazioni eccellenti (feasible ideal point), si veda, Parasuraman et al. (1991) e (1993). Questa revisione ha consentito, in sostanza, ai precedenti autori di rispondere alle critiche di Teas, si veda ad esempio, Teas (1994), dalle quali consegue, in particolare, una variante dell’indicatore elementare (P − A) da loro proposto, nel senso che dovrebbe essere sostituito da − 1 · [|P − I| − |A − I|]. In Parasuraman et al. (1994) si fa presente, infat-

Page 19: scarica quaderno

17

ti, che le due definizioni evidentemente coincidono almeno nei casi, da ritenere i più correnti, caratterizzati da valutazioni numeriche tali che A ≤ I, P ≤ I. La critica più profonda all’approccio di Parasuraman et al. è stata, però, quella mossa da Cronin et al. (1992), (1994), che hanno messo in dubbio che l’indicatore di Para-suraman et al. misuri la qualità di un servizio, come originariamente affermato da questi ultimi autori. Per Cronin et al. si deve tenere chiaramente distinto il concetto di “customer satisfaction” da quello di qualità di un servizio”; secondo convincenti studi psicometrici la “qualità di un servizio” è “concettualizzata” efficacemente come “un atteggiamento”, che si fonda sull’accumulo di esperienze precedenti e viene me-glio descritto attraverso la sola valutazione associata alla percezione attuale del servi-zio (P), rispetto alla differenza (P − A), Cronin et al. (1992), p. 58. L’indicatore (P − A) di Parasuraman et al. sembra al più potersi interpretare come espressione di una componente nel processo comparativo che porta alla “customer satisfaction”, Cronin et al. (1994), p. 126. Detti autori sostengono, in definitiva il secondo paradigma sotto indicato.

b) Il paradigma della qualità del servizio: quanto interessa alla direzione d’impresa è la valu-tazione che i clienti danno della qualità (di un servizio), che viene di volta in volta re-gistrata attraverso le percezioni “attuali” (P).

Nel paradigma alla base del SERVQUAL alle 5 dimensioni sono associate 22 variabili manifeste ripartite nel modo seguente: 4 per gli aspetti tangibili, 5 per l’affidabilità, 4 per la capacità di risposta, 4 per la capacità di rassicurazione, 5 per l’empatia, presentate nel questionario in modo speculare ma distinto al riguardo delle aspettative e delle per-cezioni. E’ anche richiesto al rispondente di assegnare ad ogni dimensione un “peso”, che ne esprima l’importanza, col vincolo che il totale dei pesi abbia valore 100 (Parasu-raman et al., 1991). Siano yj i h , zj i h , i punteggi espressi, come ricordato all’inizio, su scale ordinali a 7 punti, attinenti al rispondente h-mo, h = 1, 2, …, N, per la variabile manife-sta i-ma, i = 1, 2, …, qj , della dimensione j-ma, j = 1, 2, …, 5, e relativi, per il servizio in esame, rispettivamente, alle percezioni (valutazioni: yj i h) ed alle aspettative (zj i h). L’indicatore complessivo, diciamo pure, per quanto si è visto sopra, di “customer satis-faction” viene, in sostanza, definito come:

CSI = ∑h=1

N

∑j=1

5 wj h

i=1

qj

(y j i h − zj i h) / qj / N (4.3)

dove wj h , ∑ j wj h = 1, indicano, divisi per 100, i valori dei pesi. Si considera, quindi, per un singolo rispondente la media aritmetica delle differenze fra “percezione” ed “aspet-tativa” attinenti ad una dimensione e, quindi, la media ponderata delle precedenti medie per le diverse dimensioni; l’indicatore complessivo di “customer satisfaction” si ottiene, poi, come media aritmetica, estesa a tutti i rispondenti, dei precedenti valori individuali. Scambiando l’ordine secondo cui si eseguono le somme rispetto agli indici j ed h si han-no, come risultato intermedio, degli indicatori descrittivi del soddisfacimento rispetto alle diverse dimensioni.

Page 20: scarica quaderno

18

Se, come talvolta viene fatto, non si considerano i pesi wjh , nella (4.5) si deve porre

wj h = (qj / ∑ j qj) e si ottiene la media aritmetica delle medie aritmetiche delle differenze dei punteggi complessivamente assegnati da ciascun rispondente. Si noti che, in quest’ultimo caso, qualora non si sia provveduto a trasformazioni delle scale di punteg-gio in modo da renderle metriche, in accordo a quanto detto al precedente §3, le medie potranno convenientemente sostituirsi con le mediane, interpretando i punteggi come “ranghi” in un ordinamento. Nel paradigma di Cronin (1992), alla base del metodo cosiddetto SERVPERF, la (4.3) diviene semplicemente:

SQI = ∑h=1

n

∑j=1

5 wj h

∑i=1

q j

y j i h / qj (4.4)

dato che si considera solo la “qualità percepita”, descritta da y j i h , con la finalità di misu-rare la qualità del servizio. Si omette il cosiddetto paradigma normativo dato che, come si è ricordato sopra, nei ca-si da ritenersi i più frequenti, esso coincide con quello attinente al SERVQUAL, Parasu-raman et al. (1994).

5. Verifiche di validità dell’indicatore compositivo. Nelle fasi precedenti viene accertata, in gene-rale, la validità del modello di misurazione. Si tratta, ora, di verificare che l’indicatore compositivo prescelto è effettivamente adatto a descrivere il concetto in studio. Al ri-guardo è corrente eseguire verifiche di validità predittiva o di parallelismo, si veda Parasu-raman et al. (1991), p. 440. A tale fine, almeno nella fase di messa a punto del modello, è opportuno includere nel questionario la richiesta di informazioni aggiuntive, rispetto a quelle necessarie al calcolo dell’indicatore prescelto, quale una valutazione globale del prodotto/servizio su una corrispondente scala semantico-differenziale associata a pun-teggi; l’indicazione se il rispondente ha avuto problemi col servizio; se lo raccomande-rebbe ad “un amico”; quali sono le sue intenzioni future di riacquisto, ecc.. La disponibilità di punteggi, diciamo c v h , di valutazione globale diretta, consente di sta-bilire, mediante l’adattamento ai valori c v h di un modello di regressione lineare, con i

contributi medi per dimensione come variabili esplicative – diciamo (y−j h − z− j h) per lo schema SERVQUAL (4.3) – di accertare quanto le dimensioni considerate nella costru-zione dell’indicatore complessivo giustificano la valutazione globale diretta. Questo tipo di verifica di validità predittiva delle dimensioni incluse nel modello è utilizzato sistema-ticamente in Parasuraman et al. (1988), (1991) ed anche in Cronin et al. (1994), che con-siderano addirittura come variabili esplicative tutte le singole variabili manifeste. Le risposte, poi, a particolari quesiti, come ad esempio quello “di avere avuto o non a-vuto recentemente problemi col prodotto/servizio”, consentono di segmentare la popo-lazione dei rispondenti nei due sottoinsiemi di quanti hanno dato risposta positiva ovve-ro negativa. Ci si attende, in corrispondenza, che l’indicatore complessivo, (4.3) o (4.4) calcolato per il secondo segmento presenti un valore “significativamente” maggiore che

Page 21: scarica quaderno

19

per il primo, a conferma del carattere predittivo dell’indicatore complessivo, in riferi-mento a “concetti paralleli”, ecc. .

6. Infine un’ultima osservazione. La composizione additiva utilizzata nel SERVQUAL e nel SERVPERF è in linea con la tecnica consueta di “stimare” i valori delle variabili la-tenti – nel caso in oggetto la “customer satisfaction” – come combinazione lineare di corrispondenti variabili manifeste. Mancando, però, nel contesto in esame un esplicito modello lineare di collegamento, sono state fatte proposte alternative. Lauro et al. (1997) suggeriscono i seguenti indica-tori sintetici.

CSI2 = tr[(Y − Z)S−1(Y − Z)′] dove Y, Z, sono, rispettivamente, le matrici dei punteggi osservati per le percezioni e le aspettative, S è la matrice di covarianza campionaria attinente alle percezioni

CSI3 = tr(YY′) + tr(ZZ′) − 2tr(Γ) dove Γ è la matrice diagonale dei valori singolari di Y′Z; l’indice assume il valore 0 se e solo se Y può essere resa coincidente con Z mediante una rotazione.

5. MODELLI DIRETTI ESPLICATIVI O DECOMPOSITIVI: MODELLI DI REGRESSIONE

L’approccio compositivo lineare illustrato abbastanza in dettaglio, se anche può suscitare qualche perplessità circa la scelta, forse semplicistica, dell’indicatore complessivo che rias-sume il contributo delle varie dimensioni, – cfr. sopra 6. –, presenta, però, chiare connota-zioni di “scientificità”. Alla base dello stesso sta, infatti, la ricerca degli elementi psicologici generali che determinano la “customer satisfaction”, appunto le “dimensioni”, e di una cor-rispondente loro valida rappresentazione mediante variabili manifeste. Si cerca, in sostanza, con un faticoso lavoro sperimentale, di stabilire “leggi psicometriche” generali e di consen-tirne l’utilizzazione concreta. Il ricorso a modelli di regressione lineare, cui sopra si accen-nava, ha carattere confermativo di un struttura, già studiata accuratamente, con altri appro-priati strumenti statistici, in un complessa indagine preliminare. Nei casi concreti, però, pensiamo ai cosiddetti beni “di largo consumo” per i quali non sus-sistono riferimenti teorici consolidati come per i servizi, i modelli di regressione rappresen-tano un invito a “cortocircuitare” il complesso procedimento ricordato sopra ed a conside-rare in modo semplificato la misura globale di “customer satisfaction” e la verifica del rela-tivo costrutto concettuale. E’ un invito che le esigenze di rapidità di conclusioni e decisio-ne, collegate ad uno specifico prodotto, possono rendere interessante, ma che va accolto solo in assenza di validi riferimenti teorici generali. Nel seguito si richiameranno in modo sintetico i più consueti modelli di regressione. Si ammetterà che attraverso un questionario si sia anche ottenuta una valutazione globale o com-plessiva del prodotto/servizio in esame, diciamo cV, espressa in una scala semantico-differenziale, quindi ordinata, con associati dei punteggi convenzionali (ad esempio scala a 5 o 7 punti); detta scala potrà anche essere, o venire ridotta, a dicotomica in corrispondenza a due valutazioni riconducibili a “soddisfatto”, “non soddisfatto”.

Page 22: scarica quaderno

20

a) Modello e metodo corrente di analisi della regressione lineare. Il modello interpretativo è del tipo:

cV = β0 + β1X1 + … + βqXq + E (5.1)

dove β0 , βi , i = 1, 2, …, q, sono incogniti parametri, Xi indicano delle variabili manife-ste atte a descrivere il costrutto concettuale ipotizzato, E è una componente di errore. Le variabili Xi possono descrivere sia valutazioni su singoli aspetti del bene/servizio, come si è visto al riguardo dei modelli compositivi, ed essere espresse su scale ordinate di punteggio convenzionali, che anche riferirsi ad aspetti personali dell’intervistato, co-me l’età, il numero di acquisti dello stesso prodotto in un precedente periodo, ecc. ed essere, quindi, valutate su scale metriche. Deve, però, osservarsi come il ricorso a dati anagrafici dei rispondenti può essere giustificato nella fase di definizione della “popola-zione” di riferimento, per stabilire l’appartenenza o meno alla stessa di un soggetto. E’, però, in contrasto col carattere “socratico” del costrutto concettuale che cerca di de-scrivere tratti comuni astratti che sono presenti in ogni individuo dell’insieme conside-rato. Si veda, ad esempio, l’“esame di ammissibilità” di un rispondente ad appartenere al campione mediante il quale è calcolato l’indice nazionale ACSI. La tecnica di analisi statistica è quella basata sul principio dei minimi quadrati ordinari

per ottenere delle stime β dei parametri β. A parte l’utilizzazione dei metodi di inferen-za statistica probabilistica, basati sulla distribuzione normale, che risulta spesso forzata, la valutazione descrittiva della bontà di adattamento ai dati del modello (5.1) può farsi mediante il coefficiente di determinazione R2; molto utili sono anche le stime degli scar-

ti quadratici medi delle stime β giustificate sotto ipotesi abbastanza generiche, che non è però detto valgano per la (5.1), quale la nullità della media e la non correlazione degli errori. Il punto problematico nell’analisi della regressione, sopra richiamata per sommi capi, è che la variabile solo ordinale cV, nella relazione al secondo membro della (5.1), viene assunta come continua ed espressa su una scala ad intervalli e lo stesso dicasi, talvolta, anche per le variabili esplicative Xi che siano misurate su scale di punteggio convenzio-nali.

b) Modello di regressione non lineare con variabili latenti. In Zanella (1998), si veda anche Zanella (2000), viene proposto il seguente modello. Si suppone che le variabili esplicative Xi siano tutte di tipo categorico ordinale – misurate per semplicità su scale di punteggi in-teri con gli stessi valori – con associata una variabile categorica aleatoria X = (X1, X2, …, Xq); si ammette che ogni intervistato sia anche richiesto di assegnare a ciascuna Xi una “valutazione di importanza” o “peso”, con somma non vincolata, su una scala di punteggio ordinale. Ai pesi si associa una seconda variabile categorica aleatoria W = (W1, W2, …, Wq) che può supporsi, per semplicità, stocasticamente indipendente da X. Secondo l’approccio psicometrico di Thurstone si assume che alle variabili mani-feste X, W corrisponda una variabile latente 2q-dimensionale Z = (X*1, X*2, …, X*q ; W*1, W*2, …, W*q) le componenti della quale presentano valori non negativi con probabilità 1

Page 23: scarica quaderno

21

ed hanno funzioni di ripartizione marginali F*i(x|ai), G*i(w |bi) dove a*i , b*i sono incogniti parametri reali. Siano, in acordo alla (3.3) e con ovvio adattamento del simbolismo, Fi( j), Gi( j), j = 1, 2, …, J, le funzioni di probabilità cumulativa marginali delle variabili categoriche Xi, Wi , i = 1, 2, …, q, e si considerino le trasformazioni:

x*i(j) = F*i −1[Fi(j)|ai], w*i(j) = G*i −1[Gi(j)|bi] . (5.2)

Come modello interpretativo della valutazione complessiva cV, espressa con punteggi positivi, si propone:

cV = ∑i=1

q βiW *i(bi)X*i(ai) + ε = Y~* + ε, (5.3)

dove le variabili casuali X*i(ai), W*i(bi) sono definite dalle trasformazioni (5.2), β ≥ 0, ai, bi sono incogniti parametri reali, ε è una variabile casuale, che descrive una componente di

errore, assume valori |ε| “piccoli”, rispetto a Y~*, ed è espressa nella stessa scala. Si sup-ponga, inoltre, che le variabili X*i , W *i siano misurate su scale di rapporti. La (5.3) si in-terpreta nel senso che esistono dei valori, diciamo βi0, bi0, ai0 tali che per essi cV risulta ottenuta per discretizzazione di una variabile continua Y* misurata su una scala di rap-porti ed è, di conseguenza, essa stessa espressa su una scala di rapporti. Scelta una fami-glia di distribuzioni per la variabile latente Z e stabilito, di conseguenza, il tipo di fun-zioni F*(ai), G*(bi) – si vedano, ad esempio, quelle definite al primo membro della (3.9) – da utilizzare nelle (5.2), stime dei valori x*i ( j ) , w*i ( j ) possono ottenersi in base ai dati pro-venienti da un campione casuale, diciamo di N elementi, sostituendo le probabilità teo-riche Fi(⋅), Gi(⋅) con le loro stime calcolate mediante le frequenze relative osservate. Si dimostra che il principio dei minimi quadrati, applicato al modello continuo, sottostante alla (5.3), in generale non lineare nei parametri ai , bi , fornisce, sotto convenienti ipotesi, stime consistenti in senso forte degli incogniti parametri, βi, ai, bi . Dette stime saranno

solo approssimate dai valori βi , bi , ai ottenuti utilizzando il modello discretizzato, si ve-da Zanella (1998) e, per lo studio teorico dettagliato del metodo in discussione e della distribuzione di probabilità di cV, rispettivamente Zanella (1999), Zanella et al. (2000). La validità del modello (5.3) può essere accertata in base ai risultati campionari median-te il “coefficiente di determinazione”:

R2 = 1 −

n=1

N

c v h − ∑i=1

q βi w *i(bi)x*i(ai)

2 / ∑

n=1

N c v 2

h

dove c v h indicano i punteggi osservati, w *i n , x*i n i corrispondenti valori sperimentali sti-mati, come si è detto, utilizzando la (5.2).

c) Modello di regressione analizzato secondo la tecnica della “regressione monotona”. Una presenta-zione dell’argomento con qualche maggiore dettaglio può trovarsi in Zanella et al. (2000), qui solo se ne accenna. Si supponga che oltre alla valutazione complessiva di “customer satisfaction” cV nei confronti di un determinato prodotto/servizio, espressa,

Page 24: scarica quaderno

22

come si è detto, su una scala di punteggio intero, si disponga di valutazioni di soddisfa-cimento, misurate su scale dello stesso tipo, al riguardo di m singole caratteristiche dello stesso prodotto/servizio, che diremo valutazioni marginali. Si porrà nel seguito per sem-plicità m = 3; siano in corrispondenza x1r , x2s , x3h ∈ {1, 2, …, H}, i punteggi possibili per le tre valutazioni marginali, mentre cvr s h , q , q ∈ {1, 2, …, Qrsh}, indichi il punteggio complessivo osservato per la combinazione di punteggi marginali (x1r , x2s , x3h) ed il ge-nerico rispondente q che ha fatto tale scelta. Se di suppone di disporre dei risultati otte-nuti da un campione di N intervistati, si potranno ordinare i corrispondenti valori di va-lutazione globale, in modo non decrescente, diciamo c v (i) ∈ {1, 2, …, K}, c v (1) ≤ c v (2) ≤ … ≤ c v (N), che anche rappresentano i “ranghi ordinati” delle osservazioni. Poiché si assume per cV una scala solo ordinale, i precedenti valori sono equivalenti ad un qualsiasi altro insieme ordinato di valori z(i) = f (c v (i)), con f (⋅) una generica trasfor-mazione monotona in senso stretto. L’approccio della regressione monotona può formularsi nel presente contesto nel modo seguente. Si ritiene che esista una trasformazione monotona f *(⋅) tale che, se applicata ai dati osservati c v r s h , q , i corrispondenti valori trasformati risultano determinazioni di va-riabili casuali Zr s h , q tali che:

ξr s h = E(Zr s h , q) = β0 + β1,r + β2,s + β3,h (5.4)

∀q, dove E(⋅) indica la media in distribuzione, β0 , β1,r , β2,s , β3,h sono determinati ma

incogniti valori di corrispondenti parametri, ∑ Hr=1β1,r = ∑ Hs=1β2,s = ∑ Hh=1β3,h = 0 e, per agevolare l’esemplificazione, si ritiene che l’insieme delle modalità delle valutazioni marginali sia tale da costituite uno schema fattoriale completo H × H × H, con un nu-mero di replicazioni Qrsh in genere diverso nelle diverse “celle”, in modo da assicurare la stimabilità dei parametri del modello (5.4) secondo il principio dei minimi quadrati, applicato formalmente alle osservazioni c v r s h , q. Si noti che il modello (5.4) descrive l’effetto additivo delle modalità delle valutazioni marginali come se fossero i livelli di fattori sperimentali qualitativi; inoltre il modello ipotizza che la trasformazione f *(⋅), ri-conducendo le osservazioni ordinate a variabili casuali, riconduca i punteggi in cui è e-spressa cV ad una scala ad intervalli, che è appunto tipica delle variabili casuali. Riprendendo, con adattamento al caso in oggetto, quanto detto in Zanella et al. (2000), si ricorda che il procedimento della regressione monotona di Kruskal consente la ricer-ca, in base ad una funzione criterio, della trasformazione ottima f *(⋅) e dei corrispon-denti “valori veri” dei parametri, diciamo β0, β*i,j , (i,j) ∈ {(1,r), (2,s), (3,h)}, secondo un procedimento iterativo condotto nello spazio B × F, con B lo spazio parametrico, F quello delle trasformazioni monotone non decrescenti. Siano z(i) = f (c v (i)) i valori otte-nuti in base alla trasformazione f scelta ad un certo passo per determinati valori β0 , βi,j . La scelta è fatta in modo che se:

c v (1) ≤ c v (2) ≤ … ≤ c v (N) (5.5)

Page 25: scarica quaderno

23

sono, come si è detto, i valori di punteggio globale, ordinati in modo non decrescente, si abbia pure:

z(1) ≤ z(2) ≤ … ≤ z(N) , vale a dire i dati trasformati pure rispettino l’ordinamento iniziale. Con riferimento alla (5.4), sia ξ1(β), ξ2(β), …, ξN(β) la successione dei valori parametrici ξ r s h , (5.4), associati ordinatamente ai valori (5.5), che, si noti, non costituiscono necessariamente una suc-

cessione ordinata in senso non decrescente, e ξ−(β) ne indichi la media aritmetica. Si procede, in corrispondenza, in modo iterativo a determinare:

S( ) f *, β* = minβ

minf

i=1

N ( )z(i) − ξi(β) 2 / ∑

i=1

N (ξi(β) − ξ−)2 . (5.6)

L’indicatore (5.6) è il cosiddetto “direct-stress” ed è utilizzato per misurare la bontà di

adattamento delle stime f *, β* della trasformazione monotona e dei parametri, rispetti-vamente ottenute, si veda Kruskal (1965), anche per una presentazione tecnica essenzia-le del procedimento iterativo di ottimizzazione. Per l’applicazione concreta del procedimento sopra brevemente presentato si può far ricorso al sistema SAS, TRANSREG Procedure, utilizzato tipicamente per la conjoint a-nalysis. Esso dà in uscita la nuova scala di punteggio in cui esprimere il soddisfacimento globale cV, oltre alle stime dei parametri β0 e βi,j che descrivono gli effetti delle valuta-zioni marginali. Prove di simulazione, tuttora in corso, indicano che la caratteristica del contesto in oggetto, nel quale deve ritenersi tipica la presenza di numerose replicazioni dei valori osservati, e quindi, di cosiddetti “ties” , non sembra precludere il corretto funzionamento del programma.

d) Modello di regressione “logistica” e sua approssimazione. Si è già sottolineato in a) la grande “flessibilità descrittiva” del consueto modello di regressione lineare, che consente di a-nalizzare appropriatamente ogni tipo di variabili, sia collegate a fattori interpretativi di tipo qualitativo, tipicamente riguardanti le dimensioni del costrutto concettuale, che quantitativo, ad esempio, inerenti alle caratteristiche personali dei rispondenti. L’unica riserva è al riguardo dell’attribuzione convenzionale di carattere metrico alla scala di punteggio utilizzata per descrivere la valutazione di soddisfacimento complessivo cV. I precedenti punti b) e c) hanno indicato delle tecniche adatte a superare detto problema di scala, delle quali è certamente possibile un’estensione qualsiasi siano il numero ed il tipo dei fattori, ma, si ritiene, con qualche complicazione nel procedimento concreto di analisi statistica. Nei modelli di regressione esplicativi o decompositivi prima presentati, la distribuzione – di-ciamo pure di probabilità, anche se nei casi a) e c) l’aspetto di sola analisi dei dati può ritenersi prevalente – dei valori di soddisfacimento complessivo cV figura essenzialmen-te attraverso il “valore atteso o medio”, condizionato alle diverse situazioni osservate. L’approccio della regressione logistica consente di rispettare le caratteristiche di scala ordinale della risposta cV facendo riferimento in modo più diretto alla distribuzione di

Page 26: scarica quaderno

24

probabilità di quest’ultima. Si supponga di “dicotomizzare” la variabile cV nel senso di associare alla stessa, in genere convenzionalmente, due sole modalità: ad una, corri-spondente alla valutazione “soddisfatto”, si attribuisca il valore 1, all’altra, “non soddi-sfatto”, il valore 0. Ovviamente ci si potrà ricondurre a questa situazione ponendo nella prima classe tutte le valutazioni con punteggio superiore o eguale ad un prescelto valo-re, nell’altra le restanti (regressione logistica ordinale). Si noti che un procedimento si-mile può anche adottarsi in generale – senza precisarne il significato intuitivo – nei con-fronti di uno specifico valore di punteggio in alternativa a tutti gli altri. Si descriva, ora, il soddisfacimento complessivo come probabilità di ottenere il giudizio “soddisfatto”, condizionatamente alle modalità che certi fattori concomitanti presentano per il rispon-dente, riassunte nel vettore x, q × 1; sia P(cV = 1 | x) = P(1 | x), detta probabilità. Il modello di regressione logistica pone:

P(1 | x) = exp(β0 + β′1x)

1 + exp(β0 + β′1x) = F(β0 + β′1x) (5.7)

dove β′ = (β0, β′1) è un vettore, 1 × (q + 1), di incogniti parametri e, si ricordi che F(x) = exp(x) / (1 + exp(x)) è la funzione di ripartizione della distribuzione logistica. Si sottolinea che le componenti di x potranno essere sia i livelli di variabili quantitative metriche, che variabili descrittive del livello di fattori qualitativi ad esempio, solo ordi-nati. Quando si dispone di un campione casuale semplice di N rispondenti, se vale la (5.7), la verosimiglianza campionaria risulta essere:

L(β) = ∏i=1

N [F(β′xi)]yi [1 − F(β′xi)]1−yi (5.8)

dove xi , i = 1, 2, …, N, riassume le condizioni concomitanti attinenti al generico i-mo rispondente del campione, yi = 1 se il valore di valutazione dicotomizzato è cVi = 1. Si dimostra che, sotto opportune condizioni, riguardanti, in particolare, il comporta-mento dei vettori xi al crescere di N, se il sistema di verosimiglianza ∂logL/∂βj = 0, j = 1, 2, …, q + 1, ha una soluzione, questa è di massimo assoluto, e definisce uno sti-

matore consistente β del vettore parametrico β, asintoticamente distribuito in modo normale, si veda, ad esempio Amemiya (1985), Cap. 9. Possono, in corrispondenza , eseguirsi prove di nullità circa un sottoinsieme, diciamo βs, di incogniti parametri mediante test asintotici ottenuti in base al criterio del rapporto

delle massime verosimiglianze (nell’ipotesi di nullità dei parametri anzidetti Nβ′sS−1βs ri-sulta asintoticamente distribuita come una variabile χ2 con s gradi di indipendenza, dove

le componenti di βs sono stime di massima verosimiglianza, ottenute dal modello com-

pleto caratterizzato dal vettore di stime βs , S è la matrice asintotica di covarianza di βs

calcolata in β, ecc.). I precedenti cenni sono rivolti a fare presente come il modello di

Page 27: scarica quaderno

25

regressione logistica possa, per campioni sufficientemente numerosi, analizzarsi come si è soliti fare per un ordinario modello di regressione lineare. Dell’opportuno software, incluso nei package più diffusi, quale ad esempio l’SPSS, consente agevolmente di ese-guire detta analisi, si veda Brasini ed al. (1999) per una presentazione dell’argomento corredata di una significativa applicazione. La funzione di ripartizione logistica F ha andamento lineare intorno all’origine, ad e-sempio per x ∈ {−1.39, 1.39}, intervallo corrispondente all’incirca a valori 0.2 ≤ F(x) ≤ 0.8. Può, pertanto, essere ragionevole proporsi un’approssimazione delle probabilità pi , i = 1, 2, …, I, corrispondenti alle diverse situazioni sperimentali osserva-te, mediante un modello di regressione lineare. Questo approccio approssimato è pro-posto in De Luca (2000) con riferimento a variabili esplicative x, che siano espresse su una scala ordinale. Ad esempio, nel caso di una sola variabile esplicativa x caratterizzata da tre livelli, x1, x2, x3, e con riferimento ad un campione casuale di N rispondenti, si considera un modello interpretativo del tipo:

Y =

Y1

Y2Y3

=

p1u1

p2u2p3u3

+

E1

E2E3

=

=

u1

u2u3

p1 +

0

u2u3

(p2 − p1) +

0

0u3

[(p3 − p1) − (p2 − p1)] + E =

= u δ0 + x2 δ1 + x3 δ2 + E, (5.9)

dove Y è il vettore aleatorio delle osservazioni nel quale si suppone di avere ordinato le risposte dicotomiche in modo che nelle prime N1 posizioni figurino i rispondenti carat-terizzati dal primo livello di x, nelle successive N2 quelle caratterizzate dal secondo li-vello, nelle ultime N3 i restanti; u1, u2, u3 sono vettori con componenti unitarie di di-mensioni pari ai numeri anzidetti, 0 indica dei vettori di componenti nulle; x2 è un vet-tore colonna con le prime N1 componenti nulle e le restanti unitarie, x2 è un vettore co-lonna con le prime N1 + N2 componenti nulle e le restanti unitarie, Ei = Yi − piui, i = 1, 2, 3, sono vettori di “errori indipendenti” di media nulla e varianze σ2

i = pi(1 − pi). In quest’ultimo riferimento si noti che, in accordo al modello di regressione logistica, per i rispondenti caratterizzati (“condizionati”) da uno stesso livello xi della variabile esplica-tiva, le scelte del valore y = 1, ovvero y = 0, corrispondono ad un campione casuale semplice di dimensione Ni , da una stessa distribuzione bernoulliana elementare di pa-rametro pi ed anche si ritiene che i campioni siano indipendenti per i = 1, 2, 3. La para-metrizzazione (5.9), dove ovviamente δ0 = p1, si interpreta nel senso che: a) la media p1 attinente al primo livello, x1, del fattore esplicativo X, è presa come riferimento, b) gli effetti dei successivi livelli x2, x3, sono dati rispettivamente dalle differenze delle corri-spondenti medie da p1: (p2 − p1) per il secondo livello, (p3 − p1) per il terzo; c) l’effetto

Page 28: scarica quaderno

26

complessivo di un livello è però ottenuto come somma delle variazioni di media da un livello al seguente, necessarie per ottenere l’effetto complessivo in esame: per il terzo fattore l’effetto complessivo risulta, in particolare, (δ1 + δ2)u3 = {(p2 − p1) + [(p3 − p1) − − (p2 − p1)]}u3 = (p3 − p1)u3. Stime corrette, ottenute secondo il principio dei minimi quadrati ordinari, delle probabi-lità p1, p2, p3, si ottengono considerando le medie aritmetiche rispettivamente dei valori delle componenti dei vettori Y1, Y2, Y3 diciamo p1, p2, p3. Stime corrette dei parametri δ0, δ1, δ2 che sono funzioni stimabili dei parametri p1, p2, p3 del modello originario, si ottengono, come è noto, in base allo stesso principio in modo immediato, come p1, (p2 − p1), (p3 − p2), con varianze σ2

1/N1, (σ21/N1) + (σ2

2/N2), (σ22/N2) + (σ2

3/N3). Non si può, però, dire che siano stime efficienti data l’eteroschedasticità degli errori, che richiederebbe il ricorso al principio dei minimi quadrati generalizzati.

e) Il Modello di Rasch. (Cenni) Ha avuto origine ed utilizzazione specifica in ambito psico-metrico dove è stato, in particolare, utilizzato per graduare le difficoltà di una serie di test rivolti a misurare un “tratto latente”, ad esempio test rivolti a valutare l’attitudine alla matematica. Recentemente sono apparsi tentativi di utilizzazione del modello nell’ambito della misu-ra di “customer satisfaction” dei sevizi (si veda ad es. L. Bertoli Barsotti, 2001). Per fissare le idee si consideri una casa di riposo per anziani ed un’indagine rivolta a va-lutarne il soddisfacimento degli n ospiti. Mediante un questionario si pongono agli stessi dei quesiti su k aspetti del servizio (attributi) con risposta da esprimere su una scala di punteggio da 0 a m (categorie). Lo schema delle risposte per ogni soggetto è del tipo di seguito indicato:

PUNT. ATTR.

0 1 … h … m

VITTO ALLOGGIO xijh

PERSON. ASSIST. SA-

NIT.

Sia xijh = 1, se il rispondente i-mo, per l’attributo j-mo, esprime il punteggio h-mo, altri-menti: xijh = 0, i = 1, 2, …, n ; j = 1, 2, …, k; h = 1, 2, …, m . Spesso utilizzato è il cosiddetto “partial credit model” che è in sostanza un modello lo-gistico politomico. Con ovvie notazioni il modello è il seguente:

P(Xijh = 1|i) = πijh = exp[hϑi + (hβj + δh)]

∑ mh=0 exp[hϑi + (hβj + δh)]

dove, per un determinato soggetto, si suppone che la scelta della modalità h-ma sia in-dipendente dall’attributo j e da quella degli altri soggetti;

Page 29: scarica quaderno

27

hβj + δh descrive un aspetto latente “oggettivo” della qualità dell’attributo j (corrisponde alla “difficoltà” hβj di eseguire h “passi” in un test attitudinale “progressivo” di difficol-tà elementare βj , cui si aggiunge il termine δh , che esprime l’incremento di difficoltà per giungere fino al livello di riuscita h : δ0 = 0). hϑi descrive un tratto latente, o “atteggiamento” del singolo soggetto (ϑi descrive l’abilità del soggetto nel test attitudinale). In base a convenienti vincoli lineari sui parametri atti ad assicurarne l’identificabilità si possono ottenere stime di massima verosimiglianza ϑ^ i, β^ j, δ^ h degli incogniti parametri ϑi, βj, δh, si veda, ad es. Bertoli Barsotti (2000), e sostituire ai punteggi convenzionali xijh dei punteggi logit complessivi, quali, ad esempio

Lxij = − log

πij0

1 − πij0

che esprimono su una scala continua la propensione ad essere soddisfatto di ciascun soggetto i per ogni attributo j. Sono disponibili test per valutare l’adattamento del modello, tipicamente il test del rap-porto delle massime verosimiglianze, cfr. Vittadini (1997), § 3.3. Rimane il problema della composizione dei punteggi al variare dell’attributo per giunge-re ad una valutazione complessiva di “customer satisfaction”.

7. MODELLI STRUTTURALI LINEARI A VARIABILI LATENTI

Detti modelli consentono di completare il costrutto concettuale con il collegamento “causa-le” fra variabili “latenti”. A) Può essere conveniente, per avviare il discorso, considerare, in primo luogo, il caso “li-mite” o “degenere” nel quale ciascuna variabile latente è fatta coincidere con uno dei suoi indicatori. In effetti il modello strutturale diviene così, a meno degli errori casuali “a varia-bili osservabili”. A titolo di esempio si considera il modello trattato da Cronin et al. (1992) per metter a confronto i due approcci, SERVQUAL e SERVPERF. La Fig. 2 illlustra lo schema di collegamento fra variabili preso in esame. Esso si basa su quesiti aggiuntivi al questionario relativi alla valutazione del soddisfacimento complessivo (η1), della qualità complessiva del servizio (η2) e dell’intenzione di acquisto nel prossimo anno (η3). Gli autori si proponevano di rispondere ai seguenti quesiti, si veda Fig. 2:

1. La “valutazione” (ξ1) alla base dell’indicatore CSI del SERVQUAL (SQI del SERVPERF) ha un effetto (γ21) sulla valutazione complessiva del servizio? ξ1 → η2

2. La “customer satisfaction” complessiva ha un effetto (β12) sulla valutazione complessiva della qualità del servizio? η1 → η2

3. È vero invece il viceversa? η2 → η1 (β21) 4. La “customer satisfaction” complessiva ha un effetto diretto (β31) sull’intenzione di ac-

quisto? η1 → η3

Page 30: scarica quaderno

28

FIG. 2 Esempio semplificato di modello strutturale da Cronin et al. (1992), p. 59 e seg.

5. La valutazione complessiva della qualità del servizio ha un effetto (β32) sull’intenzione di

acquisto? η2 → η3

Come anticipato si è fatto ricorso ad un modello semplificato nel quale si assume che le va-riabili latenti coincidano con il corrispondente indicatore:

ξ1 = X1 : valore dell’indice SERVQUAL (SERVPERF) η1 = Y1 : valutazione del soddisfacimento complessivo η2 = Y2 : valutazione complessiva della qualità del servizio η3 = Y3 : intenzioni di acquisto nel prossimo anno

Si è precisamente considerato il modello seguente:

Y1

Y2

Y3

=

0 β12 0

β21 0 0

β31 β32 0

Y1

Y2

Y3

+

0

γ21

0 X1 + ζ ,

cioè, risolvendo rispetto ad Yi , i = 1, 2, 3:

Page 31: scarica quaderno

29

Y1

Y2

Y3

=

1 − β12 0

− β21 1 0

− β31 − β32 1

−1

0

γ21

0 X1 + ζ* (6.1)

= − γ21

β21β12 − 1

β12

1

β32 + β12β31

X1 + ζ*,

dove, in particolare, ζ indica un vettore di variabili casuali non correlate e, quindi, con la struttura di covarianza sottoindicata:

Ψ = E (ζζ′) =

ψ11 0 0

0 ψ22 0

0 0 ψ33

.

Si è studiato il modello (6.1), ricercando, in primo luogo, una stima degli incogniti parame-tri da cui dipende – si veda il successivo punto 2) – sulla base di osservazioni ritenute costi-tutive di un campione casuale semplice da una “popolazione infinita” (le osservazioni yih , xh, h = 1, 2, …, n, sono ritenute stocasticamente “indipendenti”). A fondamento della stima sta, tipicamente, un’equazione strutturale che stabilisce il colle-gamento fra le stime campionarie delle covarianze – o coefficienti di correlazione se le va-riabili vengono standardizzate – delle variabili osservabili del modello (Y1, Y2, Y3, X1) nel caso in studio), si veda infra B), (6.5). Nell’esempio in esame dagli elementi dati in Cronin et al. si deduce, ad esempio, per le va-riabili standardizzate relative al SERVQUAL l’equazione strutturale (di correlazione se-guente):

Y1

Y2

Y3

X1

1 SIMM.

.8175 1

.5334 .5272 1. 5605 . 5430 .3534 1

=

B*

0

γ21

0 [0 γ21 0] + Ψ B*′ ⋅

[0 γ21 0] B*′ 1

(6.2)

dove B* è la matrice inversa che figura nella (6.1). I risultati dell’analisi statistica sono ripor-tati nella seguente tabella tratta da Cronin et al. (1992), p. 64. Come viene illustrato al seguente punto B), tipici metodi di stima si basano sull’ottenimento di valori degli incogniti parametri del modello tali che sia il migliore possibile l’accostamento, secondo un prescelto criterio, fra la matrice di covarianza (di correlazione) campionaria – primo membro nella (6.2) – e quella “teorica” calcolata sostituendo le stime dei parametri nella struttura teorica – secondo membro della (6.2). Ciò è possibile col ricor-so a metodi numerici di ottimizzazione, predisposti allo scopo, come si accennerà, in vari package statistici agevolmente disponibili. La Tab. 1 tratta da Cronin et al. (1992) contiene i risultati ottenuti dagli Autori con l’approccio anzidetto nell’esame di 4 casi: istituti bancari, servizi di disinfestazione, servizi

Page 32: scarica quaderno

30

Tab

ella

1.

Da

Cro

nin

et

al.

(199

2),

p.

64,

LIS

RE

L:

acro

nim

o d

i L

inea

r St

ruct

ura

l M

odel

s w

ith

Lat

ent

Var

iab

les.

Page 33: scarica quaderno

31

di lavaggio a secco, servizi di “fast food”. Le numerosità campionarie ni utilizzate non sono esplicitamente indicate ma si ritiene che si tratti di una analisi complessiva di tutte le diverse unità aziendali esaminate in ciascun settore, e quindi, nell’ordine si abbia n1 = 188, n2 = 175, n3 = 178, n4 = 189. Per la definizione degli indicatori della bontà di adattamento dei dati al modello: χ2, AGFI, RMS che figurano nelle ultime tre righe delle sezioni orizzontali si veda ancora una volta il punto B) seguente. La Tab. 1 mostra che si può, in generale,rispondere affermativamente ai quesiti 1), 2), 4) e 5). Rimane inspiegabile, e non è giustificato dagli autori, il segno negativo del coefficiente β21 , le cui stime, però, sono in genere scarsamente significative in senso statistico. B) Come si è già anticipato i modelli strutturali lineari a variabili latenti consentono di sta-bilire il legame fra le variabili latenti associate alle dimensioni, quindi anche con quella atti-nente alla customer satisfaction che sta a fondamento del costrutto: si giunge, pertanto, alla determinazione completa del costrutto concettuale in studio. In termini generali un modello strutturale a variabili latenti presenta la seguente configura-zione

1) Insieme di equazioni strutturali

η = Bη + Γξ + ζ (6.3)

dove: B: matrice m × m di incogniti parametri; tipicamente con valori nulli sulla diagonale princi-

pale Γ: matrice m × q di incogniti parametri η: variabile causale m-dimens., E(η) = 0, variabili latenti endogene ξ: variabile causale q-dimens., E(ξ) = 0, latenti esogene, E(ξξ′) = Φ ζ: variabile causale m-dimens., E(ζ) = 0, E(η) = 0, E(ξζ′) = 0, E(ζζ′) = Ψ, errori casuali.

2) modello di misurazione associato

Y = ΛYη + ε =

Y1

MYm

=

Yλ1η1

M

Yλmηm

+ ε

X = ΛXξ + δ =

X1

MXq

=

Xλ1ξ1

M

Xλqξq

+ δ

(6.4)

dove: Y: vettore di variabili casuali osservabili, in genere 2 per ogni ηi

Yλi : vettori di incogniti parametri ε: errori casuali, E(ε) = 0, E(εε′) = Θε, E(ηε′) = E(ξε′) = 0 X, Xλj, δ: analoga configurazione, E(δ) = 0, E(δδ′) = Θδ, E(ηδ′) = E(ξδ′) = E(εδ′) = 0. In genere si ammette che da (6.3) segua:

Page 34: scarica quaderno

32

η = (I − B)−1 (Γξ + ζ); si ha allora:

Σηη = E(ηη′) = (I − B)−1{E[(Γξ + ζ)(Γξ + ζ)′]}[(I − B)−1]′ =

= (I − B)−1(ΓΦΓ′ + Ψ)[(I − B)−1]′

Σηξ = E(ηξ′) = (I − B)−1ΓΦ

e, quindi, tenuto conto della (6.4):

Σ(ϑ) =

ΣYY ΣYX

ΣXY ΣXX

=

ΛYΣηηΛ′Y + Θε ΛYΣηξΛ′X

SIMM. ΛXΦΛ′X + Θδ . (6.5)

Se ϑ è il vettore riassuntivo di tutti gli incogniti parametri, il modello è globalmente iden-

tificabile se Σ(ϑ1) = Σ(ϑ2) implica ϑ1 = ϑ2 . Equivalentemente ciò significa che, supposti assegnati i valori σij degli elementi di Σ, ϑ è univocamente determinato da tali elementi. Per le condizioni di identificabilità nel senso anzidetto si veda, ad esempio, Bollen (1989), pp. 326 e seg.. Un’ovvia regola necessaria è che, indicando con t il numero di parametri li-beri di Σ(ϑ), sia:

t ≤ ½(r + s)(r + s + 1) se nella (6.4) Y, X sono vettori di dimensioni r × 1, s × 1 rispettivamente.

METODI DI STIMA

a) Stima dei parametri 1) Criterio della massima verosimiglianza: assicura l’efficienza e la normalità a-

sintotiche. Si assume che (Y′, X′)′ abbiano distribuzione congiunta multinormale e si deve minimizzare, rispetto al vettore degli incogniti parametri ϑ, l’espressione della log-verosimiglianza data, a meno di costanti inessenziali, da:

FML = log |Σ(ϑ)| + tr(SΣ−1(ϑ)) − log|S| − (r + s)

dove S indica l’ordinaria stima della matrice di varianze-covarianze di (Y′, X′)′, (6.4), ot-tenuta da un campione di n osservazioni, ciascuna descritta da un vettore (y′j , x′j)′, j = 1, 2, …, n.

2) Criterio dei minimi quadrati generalizzato: assicura l’efficienza e la normalità

asintotiche. Non richiede l’assunzione di normalità: si deve minimizzare, rispetto a ϑ:

FGLS = 12 tr[(I − Σ(ϑ)S−1)2]

dove, nello sviluppo del quadrato, si ricordi la simmetria delle matrici Σ(⋅), S.

3) Criterio dei minimi quadrati ordinari. Non richiede l’assunzione di normalità; si deve minimizzare, rispetto a ϑ:

Page 35: scarica quaderno

33

FULS = 12 tr[(S − Σ(ϑ))2].

In tutti i tre casi l’ottimizzazione è condotta per via numerica. Esiste al riguardo una copiosa disponibilità di software incluso nei package statistici di uso corrente quali SPSS, SAS, Statistica, ecc..

b) Stima dei valori delle variabili latenti I valori delle variabili latenti possono venire stimati una volta disponibili le stime dei para-metri. Se ξ ed ε sono distribuiti secondo la legge normale, ξ può stimarsi attraverso la stima della sua media condizionata. In via approssimata si ha, precisamente:

ξi = Φ Λ′X S−X1X xi

dove Φ, ΛX sono le stime ottenute per le matrici Φ e ΛX; SXX è la matrice di varianze-covarianze di X stimata in base ai dati campionari; xi è il vettore dei valori della i-ma osser-vazione. Analogamente si ha:

ηi = Σηη Λ′Y S−Y1Y yi

Si tratta, evidentemente, in entrambi i casi di combinazioni lineari delle corrispondenti va-riabili manifeste.

c) il metodo cosiddetto dei “Partial Least Squares” (PLS)

Procede esattamente in modo opposto a quello stabilito da a) e b):

• si stimano in primo luogo i valori delle variabili latenti; • si stimano, quindi, i parametri del modello mediante il principio dei minimi quadrati or-

dinari applicato alle singole “equazioni di regressione” cui si è ricondotti sia per la parte strutturale che per le equazioni di misurazione.

Come indicato in modo semplice ed intuitivo in Bayol et al. (2001) il metodo è iterativo e si svolge secondo lo schema richiamato nel seguito, Fig. 3, con riferimento a relazioni fra va-riabili latenti e manifeste del tipo “riflessivo”, quale è quello prima considerato (la variabile latente “causa” i valori delle corrispondenti variabili manifeste). Le variabili latenti sono nel seguito indicate in modo omogeneo con ξj, le manifeste con Xjh, mentre xjh indica la media aritmetica delle corrispondenti osservazioni xjhn; i parametri del modello strutturale (6.3) sono indicati in modo omogeneo con βji, quelli del modello di misurazione con λjh.

Le caratteristiche del PLS sono le seguenti

• Non richiede specifiche assunzioni circa le distribuzioni di probabilità (“distribution free”, “independence free”) stabilisce, però, stime che non sono consistenti nel senso corrente, ma presentano solo la cosiddetta “consistency at large” che si ha quando sia il numero N di osservazioni che il numero degli indicatori Xjh tende all’infinito.

Page 36: scarica quaderno

34

SCHEMA DI CALCOLO UTILIZZATO NEL METODO PLS

• Dopo la “convergenza” di (*) si pone ξj = Yj stime secondo i minimi

quadrati ordinari: β^ j i , λ^

j h , (*) Stima ricorsiva delle variabili latenti mediante

i rispettivi indicatori Yjm = ξ^ j • Variabili strumentali eji: segno coeff. correlaz. r fra Yj e le Yi adiacenti a Yj nel modello per ipotesi • pesi ± = segno {Σh 1 ⋅ segno r(XjhYj)}, Var(ξj) = 1, ∀j

(°), (°°) Volendo passare dalle variabili scarto alle variabili originarie, posto y∼j = ∑h w∼ jhx− jh ,

ecc., le corrispondenti intercette risultano rispettivamente: (°) µj0 = y∼j − ∑i β^ j i y−i ,

(°°) λ^ j h0 = x− jh − λ^ j h( )∑i β^ j i y−i .

Fig. 3. Wold’s Partial Least Squares • consente di trattare agevolmente anche vincoli cosiddetti formativi (ad es. lo “stato so-

cioeconomico”, variabile latente, è “conseguenza” non la “causa” del reddito, del livello di educazione, ecc.) del tipo:

(ξj − µj0) = ∑h

πjh (xjh − λjh0).

In questo caso nel procedimento iterativo schematizzato nella Fig. 3 si calcolano i “pesi grezzi” come:

wj = (X′jXj)−1X′jZj ,

ξj = ∑i

βji ξi + ζj , j = 1, 2, …, m, (°)

(xjh − x− jh) = λjh ξj + εjh, (°°)

Zjn = ∑i ejiYin

wjh = Cov(Xjh , Zj) w∼ jh = ± N1/2

n

h w jh(xjhn − x− jh) 2 −1/2 w jh

Yjn = ∑h

w∼ jh (xjhn − x− jh) si inizia ad es. con w∼ j1 = 1 w∼ jh = 0, h ≠ 1

Page 37: scarica quaderno

35

dove wj è il vettore dei pesi wjh , Xj la matrice degli scarti dalla loro media aritmetica dei valori degli indicatori della variabile latente ξj . Essi sono, quindi, i coefficienti di re-gressione della variabile strumentale Zj rispetto alle variabili manifeste ad essa collegate.

• Il metodo è più orientato alla previsione di futuri valori, che all’ottenimento di stime ac-curate dei parametri

• Si dispone, per quanto noto, del solo programma di Lohmöller LVPLS 1.8.

Sussistono numerosi indicatori di tipo descrittivo della “bontà” dell’adattamento ottenuto, fra i quali ricordiamo i due seguenti. • Ogni equazione strutturale consente – in base ai valori “ricostruiti” delle variabili latenti

ad esse pertinenti – di ottenere delle stime secondo il principio dei minimi quadrati or-dinari dei corrispondenti parametri. Per ogni equazione il coefficiente di determinazione R2 consente, pertanto, di valutare il valore esplicativo del corrispondente modello in ta-le modo stimato.

• Stone-Geisser’s Q2. Sia xjhn l’osservazione del caso n-mo della h-ma variabile manifesta del blocco relativo alla variabile latente j-ma; sia xjhn la stima ottenuta mediante la corri-spondente equazione di misurazione quando si ometta detta osservazione nell’adattamento del modello. Si consideri:

Ejh = ∑n=1

N (xjhn − xjhn)

2

Ojh = ∑n=1

N (xjhn − xjhn)

2

con xjhn media aritmetica dei valori xjhn , n ∈ 1, 2, …, N, omettendo xjhn . Si definisce per il blocco j-mo:

Q 2j = 1 −

∑h

Ejh

∑h

Ojh ,

se Q2j > 0 si ritiene che il modello abbia validità predittiva.

C) In Baumgartner, Homburg (1996) si dà una presentazione sintetico-critica dell’utilizzazione dei modelli strutturali nel marketing della quale si richiamano alcuni punti focali, dove necessario, riprendendo le notazioni viste in B). • Gli autori hanno esaminato 73 applicazioni del modello completo con le seguenti carat-

teristiche:

− valore mediano della numerosità campionaria N∼ = 180 (N25 = 116, N75 = 266)

− numero mediano di variabili latenti 6, campo di variazione [4,8] − numero mediano di variabili manifeste 12, campo di variazione [9,17].

• Vengono formulate le seguenti raccomandazioni: − si “misuri” ogni dimensione mediante almeno 3 o 4 indicatori o variabili manifeste;

Page 38: scarica quaderno

36

− si usino con cautela i modelli non ricorsivi – nel modello ricorsivo la matrice B è triangolare bassa con elementi nulli sulla diagonale principale e, tipicamente, la ma-trice di varianze-covarianze degli errori ζ è diagonale – e con errori correlati;

− si cerchi di stabilire l’identificabilità teoricamente; − si fissi la scala di ogni variabile latente ponendo eguale ad 1 uno dei parametri λ ov-

vero imponendo che le varianze siano unitarie; − conviene applicare più criteri di stima e metterne a confronto i risultati; − conviene esaminare più indicatori di bontà di adattamento dei quali si ricordano i

seguenti (cfr. Bollen, 1992, p. 269 e seg.) dal significato intuitivo immediato: 1) Chi Quadrato

(N − 1)FML ∼ χ2 variabile asintoticamente distribuita, nell’ipotesi di normalità – si riveda il criterio della massima verosimiglianza – come una variabile casuale chi-quadrato con ν = 1/2(r + s)(r + s + 1) − t, se t indica il numero di parametri non vincolati del mo-dello, N la numerosità campionaria. 2) Root Mean Square Residual

RMS =

∑i=1

r+s ∑j=1

i (sij − σij)

2 / k

1/2

dove: k = (r + s)(r + s + 1) / 2, sij sono gli elementi della matrice di varianze-

covarianze delle osservazioni, σij i corrispondenti valori nella stima “parametrica” Σ di Σ(ϑ) ottenuta sostituendo ϑ con la sua stima. 3) Goodness of Fit Index, dove l’indice ML indica che si è utilizzato per la stima dei parametri il criterio della massima verosimiglianza:

GFIML = 1 − tr[(Σ−1S − I)2]

tr[(Σ−1S)2] ;

AGFIML = 1 −

k

ν (1 − GFIML)

indica che “premia”, rispetto al precedente, un modello con meno parametri. 4) Coefficienti di Determinazione per le equazioni di misura:

1 − | |Θε /| |Σyy , 1 − | |Θδ /| |Σxx , ecc..

dove | |Θε , | |Θδ indicano i determinanti delle stime delle matrici di covarianza Θε, Θδ degli errori nelle equazioni di misura. 5) Importanti sono anche le stime degli scarti quadratici medi asintotici delle stime dei parametri – secondo il criterio della massima verosimiglianza – ottenute da quelle degli elementi sulla diagonale principale della matrice inversa della matrice di informazione.

Page 39: scarica quaderno

37

7. MODELLI DI RETI BAYESIANE: CENNI

È un argomento complesso per il quale si fa rinvio a Sebastiani et al. (2000) per un’introduzione in termini operativi e di pertinenti riferimenti bibliografici al riguardo degli aspetti tecnici. Se ne accenna, comunque, poiché trattasi di modelli con caratteristiche da un lato interessanti e problematiche dall’altro. a) Si basano su schemi grafici, in analogia ai modelli strutturali; b) utilizzano solo indicatori osservabili e non ricorrono, pertanto, alla nozione di variabile latente; c) è disponibile del software che ne rende possibile l’applicazione nel caso soprattutto di modelli grafici ordina-ti aciclici (Bayesware Discoverer, Bayesware Limited); d) un loro aspetto problematico, che, però, è tipico dell’approccio bayesiano, è rappresentato dall’introduzione di distribuzioni “a priori” sui parametri, a loro volta dipendenti da iperparametri cui bisogna assegnare un va-lore; e) manca ancora un confronto critico con i modelli LISREL con i quali sembrano competere. Esempio. Per avere un’idea, sia pure molto semplificata, degli aspetti tecnici si considera un esempio. Si vuole stabilire il modello interpretativo di soddisfacimento globale per un ser-vizio di comunicazione telefonica all’assicurazione di un incidente automobilistico (cfr. Boin, 1999). Nel reticolo descrittivo del modello, si veda la Fig. 4, figurano: Y = X3, soddi-sfacimento complessivo del servizio, espresso dai rispondenti assegnando, su una scala convenzionale di punteggio, un valore y∈{1, 2, 3}; X1: durata della telefonata per la denun-cia, x1∈{1, 2, 3, 4}; X2: soddisfacimento circa la durata della telefonata, x2∈{1, 2, 3}; X4: soddisfacimento nel contatto con l’operatore, x4 ∈ {1, 2, 3}. Si vuole, ad esempio, stabilire quale dei due modelli “ordinati aciclici” sia il migliore, X1 → X2 → X4 → Y; X1 → X2 → Y. Nel primo caso sono possibili 4 × 3 × 3 × 3 = 108 percorsi ordinati, nel secondo 36. Con-sidereremo, per semplicità, quest’ultimo caso. Si supponga di poter assegnare una stessa probabilità “a priori” alla validità di uno o dell’altro modello. La probabilità che, essendo vero il modello, venga scelto dal rispondente un generico per-corso risulta, con il consueto simbolismo:

P = P(X3 = x3h , X2 = x2s , X1 = x1m ) = = P(X3 = x3h | X2 = x2s )⋅P(X2 = x2s | X1 = x1m )⋅P(X1 = x1m) =

= ϑ3sh⋅ϑ2ms⋅ϑ11m (7.1)

Σhϑ3sh = Σsϑ2ms = Σmϑ11m = 1. La precedente formula chiarisce l’ipotesi di indipendenza condizionata che può formularsi come segue “se una variabile non e’ collegata con un’altra «ascendente» del percorso non sussiste un diretto collegamento probabilistico fra le stesse”. Così X3 non e’ direttamente collegata a X1 e ciò comporta la condizione:

P(X3 = x3h | X1 = x1m , X2 = x2s ) = P(X3 = x3h | X2 = x2s ).

Ne segue, quindi, che X3 ed X1 sono “stocasticamente indipendenti, condizionatamente ad un determinato valore X2 = x2s ”; si ha, infatti:

P(X3 = x3h , X1 = x1m | X2 = x2s ) = P(X3 = x3h | X2 = x2s )⋅P(X1 = x1m |X2 = x2s)

Page 40: scarica quaderno

38

X1 X2

X4

x1:

< 5' [5',10') [10',15') > 15'

=

1

234

x2: {1, 2, 3} y=x3: {1, 2, 3} si considera il x4: {1, 2, 3} percorso X1 → X2 → Y=X3 y : 1, del tutto insoddisfatto adottando un modello di 2, soddisfatto “indipendenza condizionata” 3, molto soddisfatto come chiarito nel seguito • sono possibili 36 percorsi:

X1 1 2 3 4 ↓

X2|X1 11 12 13 14 21 22 23 24 31 32 33 34

↓ X3 1 2 3

Fig. 4. Ricerca del costrutto concettuale per la “customer satisfaction” relativa alla “denuncia telefonica” di un danno (auto) all’assicurazione

da cui segue la (7.1), moltiplicando per la probabilità di ottenere un qualsiasi valore di X2 e scambiando, quindi, nei due ultimi fattori, il condizionamento rispetto ad X2 con quello ri-spetto ad X1. Si considerino n rispondenti e si assuma che le scelte dei vari rispondenti corrispondano ad eventi stocasticamente indipendenti. A commento di detta indipendenza può osservarsi quanto segue. I diversi percorsi hanno insita una diversa “plausibilità”: ad esempio può ri-tenersi eccezionale che un tempo particolarmente lungo della telefonata di denuncia abbia in corrispondenza un punteggio alto di soddisfacimento complessivo. Nel modello in esame la diversa “plausibilità” o “razionalità” dei percorsi è descritta dalle diverse probabilità loro assegnate; il fatto che un soggetto segua un percorso o un altro è assimilato ad un’estrazione bernoulliana da un’urna dove i percorsi sono rappresentati da un numero di elementi proporzionale alle probabilità loro attribuite.

tempo al telefono per denuncia

soddisfacimento durata

soddisfacimento capacità operatore

soddisfacimento complessivo

Y=X3

Page 41: scarica quaderno

39

Pertanto, se vale il modello (7.1) la verosimiglianza campionaria risulta:

L = ∏h,s,m

(ϑ3sh ϑ2ms ϑ11m)n

hsm

= ∏k=1

4

ϑ11kn(k|11)

⋅ ∏j=1

4

∏k=1

3

ϑ2jkn(k|2j)

⋅ ∏j=1

3

∏k=1

3

ϑ3jkn(k|3j)

=

= ∏i=1

3

∏j=1

qi

∏k=1

ri

ϑijkn(k|ij) (7.2)

quando: a) nhsm indichi il numero di percorsi osservati del tipo X1 = x1m → X2 = x2S → X3 = x3h,

h = 1, 2, 3; s = 1, 2, 3; m = 1, 2, 3, 4; b) si riordino i fattori nella prima forma data alla (7.2) raggruppando in un unico termine

le potenze di eguale base;

c) si ponga, in corrispondenza: n(k|ij) =∑A nhsm con A: insieme delle terne {h,s,m} che de-

scrivono percorsi nei quali la variabile Xi ha valore Xi=xik, con variabile antecedente Xi−1 di valore Xi−1=xi−1j, i=2,3; per i=1 , X1 è variabile antecedente di se stessa,

(ad es. n(k|31) =nk11 + nk12 + nk13 + nk14 ; n(k|11) =∑h,s

nhsk );

d) nella (7.2): r1=4, r2=r3=3; q1=1, q

2=4, q

3=3 .

La (7.2) è un’espressione valida in generale, con un conveniente adattamento circa il signifi-cato dell’indice j, anche nel caso di “nodi” sui quali insista più di un solo diretto anteceden-te, si veda Cooper et al (1992). Si assuma ora per ciascun insieme di parametri ϑijk , k=1,2,…,ri , ∀i,j , una distribuzione “a priori” della famiglia di Dirichlet, stocasticamente indipendente da quella di ciascun altro. La verosimiglianza campionaria marginale si ottiene considerando la media dell’espressione (7.2) rispetto alle precedenti distribuzioni “a priori”. Si ottiene, in corrispondenza:

L* = ∏i=1

3

∏j=1

qi

⌡⌠

Θ

ϑn(1| ij)ij1 ⋅ … ⋅ ϑn(r*

i | ij)ijr*

i (1 − ∑k=1

r*i

ϑijk)n(ri| ij) ⋅

⋅ Γ(αij1 + … + αijri)

Γ(αij1) ⋅ … ⋅ Γ(αijri) ϑαij1−1

ij1 ⋅ … ⋅ ϑαijr*

i − 1ijr*

i (1 − ∑

k=1

r*i

ϑijk)αijri−1

dθij1…dθijri

= ∏i=1

3

∏j=1

qi

Γ(αij•)

Γ[(αij• + n(ij))] ⋅ ∏k=1

ri

Γ(αijk + n(k| ij))

Γ(αijk) ,

dove:

0 ≤ ϑijk ≤ 1; ∑k=1

ri

ϑijk ≤ 1, r*i = ri − 1;

αijk > 0 sono valori arbitrari che possono essere scelti convenientemente, in modo da e-sprimere il grado di incertezza” attribuibile “a priori” ai parametri del modello: scelto

Page 42: scarica quaderno

40

α > 0, valori costanti ∀j,k , αijk = α/qiri possono utilizzarsi nel caso di completa “ignoranza iniziale”;

αij• + n(ij) = Σk (αijk + n(k| ij)),

αij• = Σk αijk ;

Γ(⋅) indica la funzione gamma. La verosimiglianza L* viene calcolata per ciascuno dei modelli alternativi. Ritenendoli, come si è detto, “a priori” equiprobabili, si sceglie quello per il quale si ottiene il massimo valore L*.

8. CONCLUSIONI

• Si è visto come la nozione o concetto di “customer satisfaction” abbia carattere rela-zionale. Mentre una grandezza fisica come un peso, una lunghezza, ecc., possono de-scriversi mediante una misura che, con riferimento alla propria unità standard, ha un si-gnificato preciso e completo, una valutazione di soddisfacimento complessivo nei con-fronti di un servizio o prodotto data, ad esempio, su una scala di punteggio convenzio-nale acquista un significato preciso solo in riferimento al “costrutto concettuale” cioè agli aspetti o alle dimensioni del servizio/prodotto che si assumono come determinanti in detta valutazione.

• Il vettore delle valutazioni collegate alle varie dimensioni risulta determinante, al punto che ci si può chiedere se non sia tale descrizione multivariata quella che meglio rappre-senta la natura profonda della nozione di “customer satisfaction”.

• I modelli compositivi ed i corrispondenti indicatori, come quelli utilizzati nel SERVQUAL (SERVPERF), corrispondono, in fondo, ad una tale posizione, in quanto non danno autonomia sperimentale al soddisfacimento o alla valutazione complessiva, ma li definiscono come una “sintesi conveniente”, in fondo arbitraria, delle valutazioni attinenti alle varie dimensioni.

• I modelli decompositivi o di regressione tengono conto del carattere autonomo ma “relazionale” del soddisfacimento complessivo e tendono a stabilire direttamente, attra-verso le variabili manifeste, il costrutto concettuale, in cui e’ “incapsulata” la nozione di “customer satisfaction”. A rigore sono giustificati soprattutto come modelli confermati-vi di un costrutto già individuato. L’apparato imponente di strumenti di analisi statistica disponibile per questo approccio non deve distrarre di volta in volta dalla riflessione sulla natura dei risultati: analisi dei dati o inferenza statistica che consente previsioni?

• I modelli strutturali lineari a variabili latenti consentono lo studio completo del co-strutto concettuale nel senso che consentono di studiare e stimare gli effetti delle varia-bili latenti (dimensioni) sia fra loro che sul soddisfacimento complessivo. In questo senso rappresentano lo strumento statistico più valido disponibile al momento attuale per l’individuazione sperimentale di un costrutto concettuale. Il modello non consente,

Page 43: scarica quaderno

41

in effetti, la determinazione univoca dei valori delle variabili latenti utili per ottenere in-dicatori riassuntivi delle stesse, in particolare di quella descrittiva del soddisfacimento complessivo (si pensi, in particolare, agli indicatori nazionali), i valori delle quali do-vranno essere stimati. Ciò in quanto le variabili osservabili sono in numero di (r + s), mentre quelle latenti, includendo le componenti di errore, sono in numero di (r + s + m + q). Questo aspetto non può considerarsi una peculiarità negativa specifica dell’approc-cio in esame. A ben vedere anche nei modelli di regressione si è soliti sostituire i valori osservati per il soddisfacimento complessivo con i corrispondenti predittori (medie condizionate). Il metodo cosiddetto del “partial least squares” consente “simultaneamente” sia la stima dei valori delle variabili latenti che dei parametri del modello. È il metodo correntemen-te utilizzato per importanti indici nazionali come l’ACSI (American Customer Satisfac-tion Index) e l’ECSI (European Customer Satisfaction Index). Non mancano, in effetti, critiche a tale metodo collegate alla mancanza di consistenza ed efficienza asintotica de-gli stimatori dei parametri ed alla constatazione che gli stimatori delle variabili latenti e degli errori non rispettano, in generale, le condizioni di non correlazione assunte tipi-camente per i modelli lineari strutturali a variabili latenti, si veda, ad esempio, G. Vitta-dini (1992).

• L’analisi statistica della “customer satisfaction” per essere condotta in modo rigoroso richiede un ampio ricorso ai metodi di analisi statistica multivariata e quindi a sof-tware molto articolato e complesso. Siamo nell’ambito della “nuova statistica” che può realizzarsi solo con l’utilizzo sistematico di un computer e, quindi, di programmi di cal-colo che spesso costituiscono una “scatola nera”, della quale non è sempre agevole comprendere fino in fondo le risposte. La chiarezza dei manuali di illustrazione del sof-tware rappresenta, pure nel caso in studio, un elemento essenziale, anche se non sempre realizzato.

• Lo sguardo di insieme dato all’argomento indica, poi, alcune possibili linee di ricerca. − È auspicabile, in primo luogo, una ricerca di base rivolta a proporre, se possibile, dei

costrutti concettuali “ben fondati” anche per classi di “beni durevoli”, in aggiunta a quanto è già disponibile per i servizi. L’obiettivo finale dovrebbe essere quello di giungere pure per la “customer satisfaction” ad una normativa ufficiale, che sarebbe essenziale per ottenere “oggettività” e quindi “compatibilità” anche in questo impor-tante settore.

− Rimangono, inoltre, da sviluppare o approfondire importanti argomenti metodo-logici: a) il problema dell’utilizzazione delle scale di punteggio solo ordinali e della loro eventuale trasformazione in scale almeno ad intervalli, integrato da quello dell’esame della robustezza nei loro confronti dei metodi statistici correntemente impiegati; b) il problema della identificabilità dei modelli strutturali a variabili latenti con equazioni di misurazione “formative”, nelle quali, cioè, le variabili latenti – tutte o alcune – sono espresse in funzione di corrispondenti variabili manifeste; c) lo svi-luppo sistematico, anche attraverso l’esame di casi reali, della formulazione dinamica

Page 44: scarica quaderno

42

dei modelli lineari a variabili latenti; d) la valutazione critica delle possibilità operati-ve offerte dall’approccio delle reti bayesiane nella definizione dei costrutti concettuali, come possibile alternativa ai modelli strutturali lineari a variabili latenti.

RIFERIMENTI BIBLIOGRAFICI

§1 Introduzione

Anderson E.W., Fornell C. (2000), “Foundations of the American Customer Satisfaction Index”, Total Quality Management, 11, 869-882.

Kanji G.K., Wallace W. (2000), “Business excellence through customer satisfaction”, Total Quality Management, 11, 979-998.

Vedaldi R. (1997), “Modelli interpretativi per la valutazione della Customer Satisfaction: l’impiego degli strumenti statistici”, Atti del Convegno “La statistica per le imprese”, So-cietà Italiana di Statistica, Vol. I, 583-596.

Zanella A. (2000), “Valutazione della qualità e Customer Satisfaction: il ruolo della Statisti-ca. Presentazione”, Atti della Giornata di studio sul tema, Bologna 24 settembre 1999, Vita e Pensiero, Milano, pp. I- XXIV.

Zanella A. (2001), “Valutazioni e modelli interpretativi di «Customer Satisfaction»: conclu-sioni e prospettive”, Dispensa del Corso “Metodi statistici per la misurazione della Customer Satisfaction”, Scuola della Società Italiana di Statistica, Roma 26 febbraio - 2 marzo.

Zanella A. (2001), “Valutazioni e modelli interpretativi di Customer Satisfaction: Ricerca di un Quadro Complessivo”, Atti del Convegno “Processi e Metodi Statistici di Valutazione”, Sessioni plenarie, specializzate, satellite della Società Italiana di Statistica, 113-120.

Zanella A. (2001), “Measures and Models of Customer Satisfaction: the underlying lying Conceptual construct and a Comparison of different Approaches”, Proceedings of the 6th Congress for Total Quality Management, St. Petersburg, Vol. 1, 427-441.

§2 Il costrutto concettuale

Bollen K.A. (1989) Structural Equations with Latent Variables, Wiley, NY. Brasini S., Neri R., Tassinari G. (1999), “Qualità percepita e posizionamento competitivo:

l’esperienza di Coop Adriatica”, Statistica Applicata, 3, 395-419. Cassel C.M., Hackl P., Westlund A.H. (2000), “On measurement of intangible assets: a

study of robustness of partial least squares”, Total Quality Management, 11, 897-907. Evrard Y. (1993), “La satisfaction des consommateurs: état des recherches”, Revue Française

du Marketing, 144-145, pp. 53-65. Hunt H.K. (1977) “CS/D – Overview and Future Directions”, in: Hunt H.K. ed., Conceptu-

alization and Measurement of Customer Satisfaction and Dissatisfaction, Marketing Science Institute, Cambridge, MA.

Manaresi A., Marzocchi G., Tassinari G. (2000), “La soddisfazione del cliente dei servizi di segreteria universitaria: un modello a equazioni strutturali”, Atti della Giornata di Stu-

Page 45: scarica quaderno

43

dio: Valutazione della qualità e Customer Satisfaction: il ruolo della Statistica, Bologna 24 settembre 1999, Vita e Pensiero, Milano.

Parasuraman A., Zeithaml V.A., Berry L.L. (1988) “SERVQUAL: a Multiple-Item Scale for measuring Customer Perceptions of Service Quality”, Journal of Retailing, 1, 11-40.

§3 Il problema delle scale ordinali

Bartholomew D.J. (1983), “Latent variable models for ordered categorical data”, Journal of Econometrics, 22, 229-243.

Franceschini F., (1997), “Carte di controllo per variabili qualitative: un metodo basato sul’uso dei quantificatori linguistici”, Qualità, Suppl. n. 5, 71-76.

Franceschini F., (2001), Dai prodotti ai servizi: le nuove frontiere per la misura della qualità, UTET, Torino.

Herzel A. (1974), “Un criterio di quantificazione: Aspetti statistici”, Metron, Vol. XXXII, n. 1-4, 3-54.

Keller W.J., Wansbeek T. (1983), “Multivariate methods for quantitative and qualitative data”, Journal of Econometrics, 22, 91-111.

Zanella A., Cerri M. (2000), “La misura di Customer Satisfaction: qualche riflessione sulla scelta delle scale di punteggio”, Atti della Giornata di studio: Valutazione della qualità e Customer Satisfaction: il ruolo della Statistica, Bologna 24 settembre 1999, Vita e Pensie-ro, Milano, 217-231.

§4 Modelli formativi o compositivi

Babakus E., Boller G.W. (1992), “An empirical Assessment of the SERVQUAL scale”, Journal of Business Research, 24, 253-268.

Caldara M., Cignetti M., Franceschini F. (1997), “Strumenti a confronto per la valutazione della qualità nei servizi”, 1a parte, Qualità, XXVII, 3, 36-41.

Cronin J.J., Jr., Taylor S.A. (1992), “Measuring Service Quality: A Reexamination and Ex-tension”, Journal of Marketing, 56, 55-68.

Cronin J.J., Jr., Taylor S.A. (1994), “SERVPERF versus SERVQUAL: Reconciling Per-formance-Based and Perceptions-Minus-Expectations Measurement of Service Quality”, Journal of Marketing, 58, 125-131.

Kristensen K., Kanji G.K., Dahlgaard J.J. (1992), “On measurement of customer satisfac-tion”, Total Quality Management, 3, 123-128.

Lauro N.C., Balbi S., Scepi G. (1997), “L’analisi multidimensionale dei dati per la misura-zione della “Customer satisfaction” nei servizi”, Atti del Convegno “La statistica per le imprese”, Società Italiana di Statistica Vol. I, 567-581.

Parasuraman A., Berry L.L., Zeithaml V.A. (1991), “Refinement and Reassessment of the SERVQUAL Scale”, Journal of Retailing, 67, 420-450.

Parasuraman A., Berry L.L., Zeithaml V.A. (1993), “Research Note: More on improving Service Quality Measurement”, Journal of Retailing, 69 (Spring).

Page 46: scarica quaderno

44

Parasuraman A., Berry L.L., Zeithaml V.A. (1994), “Reassessment of the Expectations as a Comparison Standard in Measuring Service Quality: Implications for Further Re-search”, Journal of Marketing, 58, 111-124.

Teas R.K. (1994), “Expectations as a Comparison Standard in Measuring Service Quality: An Assessment of a Reassessment”, Journal of Marketing, 58, 132-139.

§5 Modelli diretti esplicativi o decompositivi

Amemiya T. (1985), Advanced Econometrics, Blackwell Ltd., Oxford, U.K.. Bertoli Barsotti L. (2000), “Assessing customer perceptions of service quality by politho-

mous Rasch model: existence and uniqueness of the maximum likelihood estimates”, Atti della Giornata di studio: Valutazione della qualità e Customer Satisfaction: il ruolo della Statistica, Bologna 24 settembre 1999, Vita e Pensiero, Milano, 255-273.

Bertoli Barsotti L. (2001), “Analisi della Soddisfazione del Paziente in una Struttura Sani-taria”, Università Cattolica del S.Cuore, Istituto di Statistica, Serie E.P., n. 104.

De Luca A. (2000), “Un modello di misurazione della Customer Satisfaction con codifica binaria additiva dei predittori ordinali”, Atti della Giornata di studio: Valutazione della qualità e Customer Satisfaction: il ruolo della Statistica, Bologna 24 settembre 1999, Vita e Pensiero, Milano, 275-290.

Johnson R.A., Wichern D.W. (1992), Applied Multivariate Analysis, Prentice-Hall Interna-tional.

Kruskal J.B. (1965), “Analysis of Factorial Experiments by Estimating Monotone Trans-formations of Data”, Journal of the Royal Statistical Society, Seires B, 27, 251-263.

Louviere J.J., Woodworth G. (1983), “Design and Analysis of Simulated Consumer Choice or Allocation Experiments: An Approach Based on Aggregate Data”, Journal of Mar-keting Research, XX, 350-367.

Vittadini G. (1997), “Una metodologia statistica per la «performance evaluation» dei servizi alla persona di pubblica utilità”, Atti del Convegno SIS: La Statistica per le imprese, Tori-no, Vol. 1, 387-401.

Zanella A. (1998), “A Statistical Model for the Analysis of Customer Satisfaction: Some Theoretical and Simulation Results”, Total Quality Management, 9, 599-609.

Zanella A. (1999), “A Stochastic Model for the Analysis of Customer Satisfaction: Some Theoretical Aspects”, Statistica, LIX, 3-40.

Zanella A., Cantaluppi G. (2000), “On the probability distribution of a bilinear indicator of Customer Satisfaction”, Atti della Giornata di studio: Valutazione della qualità e Customer Satisfaction: il ruolo della Statistica, Bologna 24 settembre 1999, Vita e Pensiero, Mila-no, 233-253.

§6 Modelli strutturali

Amenta P., D’Ambra L. (2000), “Constrained Principal Component Analysis with External Information”, Statistica Applicata, 12, 7-29.

Page 47: scarica quaderno

45

American Society for Quality (1998), American Customer Satisfaction Index: Methodology Report, Milwaukee, WI.

Babakus E., Ferguson C.E. Jr., Jöreskog K.G. (1987), “The Sensitivity of Confirmatory Maximum Likelihood Factor Analysis to Violations of Measurement Scale and Dis-tributional Assumptions”, Journal of Marketing Research, XXIV, 222-228.

Baumgartner H., Homburg C. (1996), “Application of Structural Equation Modeling in Marketing and consumer Research: A Review”, Intern. Journal of Research in Marketing, 13, 139-161.

Bayol M.P., de la Foye, Morineau, Tellier C., Tenenhaus M. (2001), “Use of the PLS ap-proach to estimate the European Customer Satisfaction Index (ECSI) model”, Di-spensa del Corso “Metodi Statistici per la Misurazione della Customer Satisfaction”, Scuola della Società Italiana di Statistica, Roma 26 febbraio – 2 marzo.

Cassel C.M., Hackl P., Westlund A.H. (1999), “Robustness of partial least-squares method for estimating latent variable quality structures”, Journal of Applied Statistics, 26, 435-446.

Dijkstra T. (1983), “Some comments on maximum likelihood and partial least squares methods”, Journal of Econometrics, 22, 67-90.

Fornell C., Bookstein F.L. (1982), “Two Structural Equation Models: LISREL and PLS Applied to Consumer Exit-Voice Theory”, Journal of Marketing Research, 19, 440-452.

Fornell C., Cha J. (1994), “Partial Least Squares”, in: Bagozzi R. ed., Advanced Methods of Marketing Research, Blackwell Pub., Cambridge, MA, 52-78.

Jöreskog K. (1994), “On the Estimation of Polychoric Correlations and their Asymptotic Covariance Matrix”, Psychometrika, 59, 381-389.

Lohmöller J.-B. (1989), Latent Variable Path Modeling with Partial Least Squares, Physica-Verlag Heidelberg.

Muthén B. (1984), “A General Structural Equation Model with Dichotomous, Ordered Categorical and Continuous Latent Variable Indicators”, Psychometrika, 49, 115-132.

Tenenhaus M., Gauchi J.-P., Ménardo C. (1995), “Régression PLS et applications”, Revue de Statistique Appliquée, XLIII(1), 7-63.

Vittadini G. (1992), “Un confronto fra un modello di analisi causale con variabili latenti e metodi alternativi”, Statistica, LII, 379-396.

Vittadini G. (1999), “Analysis of Qualitative Variables in Structural Models with Unique Solutions”, in: Vichi M., Opitz O. eds. Classification and Data analysis: Theory and Ap-plications, Studies in Classification, data analysis and knowledge organization, Springer Verlag, Heidelbeg, 203-210.

Wold H. (1966), “Estimation of Principal Components and Related Models by Iterative Least Squares”, in: Krishnaiah P.R. ed., Multivariate Analysis, Academic Press, NY, 391-420.

Wold H. (1985), “Partial Lest Squares”, in: Kotz S., Johnson N.L. eds., Encyclopedia of Statis-tical Science, Vol. 6, Wiley, New York, 581-591.

Page 48: scarica quaderno

46

§7 Modelli di reti bayesiane

Boin A. (1999), Proposta di un metodo di taratura e di controllo dei risultati per un questionario di Customer Satisfaction, Tesi di Laurea, Politecnico di Milano, 3° Premio di AICQ Cen-tronord per “Tesi su Qualità e Ambiente”, Milano.

Cooper G.F., Herskovits E. (1992), “A Bayesian Method for the Induction of Probabilistic Networks from Data”, Machine Learning, 9, 309-347.

Ramoni M., Sebastiani P. (1997), Bayesian Inference with Missing Data Using Bound and Collapse, KMi Technical Report Kmi-TR 58, Knowledge Media Institute, The Open Univer-sity, Milton Keynes, UK.

Ramoni M., Sebastiani P. (1998), Bayesian Methods for Intelligent Data Analysis, KMi Technical Report Kmi-TR 67, Knowledge Media Institute, The Open University, Milton Keynes, UK.

Sebastiani P., Ramoni M., Crea A. (2000), Profiling your Customers Using Bayesian Networks, KMi Technical Report Kmi-TR 90, Knowledge Media Institute, The Open Univer-sity, Milton Keynes, UK.

ABSTRACT

Nowadays increasing attention is paid to the subject of customer satisfaction and related papers are giving rise to an astonishingly wide literature. Thus it may seem appropriate to try to point out the main traits of the matter to further a better understanding of the com-plex topic and of its possible future development. The following aspects will be considered in short: a) The measurement process that with reference to a detailed verbal definition of a con-

cept of interest – overall customer satisfaction in our case – and a related conceptual con-struct, which defines the so-called dimensions, links the latter to possible manifest or ob-servable variables.

b) The typical case of manifest variables that are only ordinal and the problem of re-scaling. c) Composition or formative models: given the appropriateness of the conceptual construct and

a corresponding measurement process (model), overall customer satisfaction is measured by a possible weighted average of manifest variables.

d) Decomposition or explanatory models: overall customer satisfaction is also assumed to be a manifest variable and the corresponding model is validated through a regression model – “linear” or “logistic” – based on the other manifest variables. Also Rasch model is re-ferred to this context.

e) Structural models: the overall customer satisfaction is a latent variable, but the covariance structure of the model can be validated.

f) Bayesian Network models: all variables are assumed to be manifest, including overall cus-tomer satisfaction; an exploratory as well as confirmatory analysis of the model is pos-sible but it requires an “a priori” distribution on the corresponding unknown parame-ters.

The comparison is focused on: 1) scale problems, 2) available software.