Modélisation du comportement viral des internautes lors de ...

23
Modélisation du comportement viral des internautes lors de jeux promotionnels en ligne Christine Balagué Maître de conférence IAE-Université des Sciences et Technologie Lille 1 LEM- UMR CNRS 8179 Adresse: IAE Lille 104 avenue du peuple belge 59043 Lille Cedex Téléphone: 03 20 12 34 50 Email : [email protected] Nous remercions la société Millemercis, en particulier son directeur général Thibaut Munier, pour l’ensemble des données qui nous ont permis de mener cette recherche et pour ses remarques et conseils lors de réunions intermédiaires. 1

Transcript of Modélisation du comportement viral des internautes lors de ...

Page 1: Modélisation du comportement viral des internautes lors de ...

Modélisation du comportement viral des internautes

lors de jeux promotionnels en ligne

Christine Balagué

Maître de conférence IAE-Université des Sciences et Technologie Lille 1 LEM- UMR CNRS 8179 Adresse: IAE Lille 104 avenue du peuple belge 59043 Lille Cedex Téléphone: 03 20 12 34 50

Email : [email protected] Nous remercions la société Millemercis, en particulier son directeur général Thibaut Munier, pour l’ensemble des données qui nous ont permis de mener cette recherche et pour ses remarques et conseils lors de réunions intermédiaires.

1

Page 2: Modélisation du comportement viral des internautes lors de ...

Modélisation du comportement viral des internautes

lors de jeux promotionnels en ligne

Résumé :

L’efficacité des jeux promotionnels en ligne à mécanisme viral repose sur la capacité des

internautes à fournir des adresses email permettant aux entreprises de créer d’importantes

bases de données de prospects. Nous modélisons dans cet article le comportement viral des

participants à ce type de jeu en ligne. Notre modèle repose sur trois jeux de près d’un million

de joueurs chacun. Nous modélisons le nombre d’adresses emails par des réseaux bayésiens à

partir de cinq variables issues de questions de qualification qui peuvent être administrées dans

un questionnaire préalable au jeu

Mots-clés : marketing viral, modélisation, jeu promotionnel, Internet , comportement des

internautes, réseaux Bayésiens

Abstract:

The efficiency of promotional on line games based on viral mechanism relies on the web user

capacity to provide email addresses allowing companies to build important databases of

prospects. In this article, we model the viral behavior of participants to this games. Our model

is based on three on line games gathering each of them around one million participants. We

model the number of email addresses provided in the game by using Bayesian networks. We

show that five qualification variables, that can measured before the game, can predict the

number of viral addresses provided.

Key words: viral marketing, modeling,, promotional game, Internet, web user behaviour,

Bayesian networks

2

Page 3: Modélisation du comportement viral des internautes lors de ...

INTRODUCTION : La compréhension du marketing viral développé dans les jeux promotionnels en ligne est un

réel défi pour les entreprises qui orientent leur stratégie marketing sur internet. La majorité

des jeux promotionnels en ligne ont pour objectif la création pour les entreprises

d’importantes bases de données de prospects qui pourront ensuite être contactés par des

opérations de marketing direct. En France, de grandes entreprises comme la SNCF (pour son

site www.voyages-sncf.com), Expedia (le leader mondial du domaine des voyages), Sephora

(grand distributeur spécialisé de cosmétiques), Nespresso comme de nombreuses plus petites

entreprises (Ipso Presto par exemple, sur le marché des fournitures de bureau) utilisent ce type

d’opérations. Les bases de données issues de ces opérations sont riches d’informations car

elles comportent un nombre élevé de variables dû à la simplicité de recueil d’informations sur

Internet. Cependant, de nombreuses entreprises hésitent encore à appliquer cette démarche en

raison de leur non maîtrise théorique du phénomène. La première crainte provient du fait que

le marketing viral crée des systèmes nouveaux et complexes: des individus transmettent des

messages à d’autres, qui vont eux-mêmes soit se comporter de la même manière, soit stopper

le processus. Se créent ainsi des « chaînes » de plusieurs générations d’internautes, mais on ne

sait ni comment cela démarre, ni comment ce phénomène s’arrête. La deuxième crainte est

l’ampleur des processus engendrés par les jeux promotionnels en ligne à caractère viral. Le

nombre de participants à ce type d’opération peut en effet facilement dépasser le million

d’internautes. Les entreprises redoutent par conséquent le fait de ne pas pouvoir maîtriser ces

phénomènes par manque d’expérience. Enfin, la troisième crainte concerne l’efficacité de ce

type de jeux. Celle-ci repose sur le comportement des internautes qui soit « viralisent » (c’est-

à-dire donnent au moins l’adresse email de l’une de ses connaissances), soit ne « viralisent »

pas. Dans ce dernier cas, l’opération n’aura que peu d’effet. Les managers aujourd’hui ont

donc l’impression de ne pas maîtriser l’opération et son efficacité. Pour répondre à ces

interrogations, il semble donc important de s’intéresser au potentiel viral des internautes afin

de mieux comprendre ces phénomènes de marketing viral et de maîtriser leur mécanisme.

Sur le plan académique, les chercheurs en marketing ont, durant les dernières années, analysé

les spécificités d’Internet, mais peu de recherches portent sur la modélisation des jeux

promotionnels en ligne à caractère viral. Plusieurs auteurs se sont intéressés au design des

sites Web, à leur trafic (Mandel et Johnson 2002, Ansari et Mela (2003), Lynch et Ariely

2000, Zauberman 2003). Un autre courant de recherche porte sur la modélisation du

comportement de visite et d’achat on line (Sismeiro et Bucklin 2004, Moe et Fader 2004a et

3

Page 4: Modélisation du comportement viral des internautes lors de ...

2004b, Park et Fader 2004). En raison du peu d’articles dans la littérature et de la

problématique managériale existante sur ce sujet, l’objectif de cette recherche est donc de

déterminer la manière dont on peut mesurer et prévoir le comportement viral des internautes

dans le cas de jeux promotionnels en ligne. Ceci permettrait de mieux maîtriser ces opérations

de marketing viral en sélectionnant dès le départ les « bons » internautes (ceux qui fourniront

le plus d’adresses email).

L’article qui suit est organisé de la manière suivante : nous décrivons tout d’abord le cadre

théorique de notre recherche puis détaillons les trois jeux promotionnels on line que nous

avons utilisés dans cette recherche. Dans une troisième partie, nous proposons un premier

modèle représentant le fait qu’un participant au jeu fournisse ou non une adresse email. Dans

une quatrième partie nous modélisons le nombre total d’adresses email engendrées par le

joueur. Enfin, nous présentons les limites de cette recherche avant de conclure et présenter des

pistes de recherche futures.

CADRE THEORIQUE:

Notre recherche s’appuie sur les courants de recherche portant sur le bouche à oreille

et le marketing viral. Depuis de nombreuses années, plusieurs recherches en marketing

portent sur les phénomènes de bouche-à-oreille (Arndt 1968; Bansal et Voyer 2000; Bowman

et Narayandas 2001; Walker 2001). Certains articles issus de la littérature managériale

développent même l’idée selon laquelle les processus de communication fondés sur le bouche

à oreille constituent une force puissante sur un marché (Marney, 1995 ; Silverman, 1997). Le

bouche à oreille correspond à une communication informelle, à la fois positive et négative, sur

les caractéristiques d’un fournisseur et/ou ses produits (Tax et al. 1993).

Plusieurs recherches proposent des échelles pour mesurer la communication par bouche-à-

oreille (Walker, 2001). D’autres capturent le phénomène en mesurant le nombre de sources de

références consultées, la force des liens (relations dyadiques interpersonnelles dans le

contexte des réseaux sociaux), ou la centralité (comment un acteur est stratégiquement placé

dans un réseau) (Money, Gilly et Graham, 1998).Goldenberg, Libai et Muller (2001) utilisent

des automates et des processus stochastiques pour analyser le phénomène sous-jacent du

bouche-à-oreille. Nous retiendrons dans cette littérature deux recherches en particulier qui

proposent d’analyser le bouche-à-oreille par des analyses de réseau. Le premier article est un

article de référence sur le bouche-à-oreille par Brown et Reigen (1987) qui présentent une

analyse de réseau du comportement de bouche à oreille dans un environnement naturel. Ils

4

Page 5: Modélisation du comportement viral des internautes lors de ...

examinent le comportement de bouche à oreille grâce à la force de lien et l’homophilie

(niveau auquel des paires d’individus sont similaires sur certains attributs comme l’âge, le

sexe et l’éducation). . Leur étude met en évidence au niveau macro et micro les différents

rôles joués par les liens sociaux faibles et forts. Au niveau macro, les faibles liens exercent

une fonction de passerelle, permettant à l’information de circuler d’un sous-groupe distinct

d’acteurs à un autre sous-groupe dans un système social plus large. Au niveau micro, les forts

liens et l’homophilie sont activés pour développer le flux d’informations auquel les individus

vont se référer. Le deuxième article, de Bristor (1990), propose aussi une approche de réseau

pour étudier le bouche à oreille. L’auteur affirme qu’un réseau de bouche à oreille est un

réseau social de personnes qui s’engagent, en plus des relations qu’elles ont entre elles.

Cependant, même si la littérature en marketing sur le bouche-à-oreille est riche, les recherches

sur le marketing viral sont peu nombreuses. Utilisant le même mécanisme que le bouche-à-

oreille mais sur Internet, la notion de marketing viral a été utilisée par Steve Jurvetson en

1996 pour décrire la stratégie marketing du service gratuit d’e-mail Hotmail (chaque e-mail

arrivant dans la boite de réception comportait le message : « Get your private, free e-mail

from Hotmail at http://www.hotmail.com » avec la recommandation personnelle de

l’expéditeur). Les nombreux articles managériaux sur le marketing viral se résument

essentiellement à la présentation de cas d’entreprises à succès. Les exemples comme Beanie

Babies, the Blair Witch Project, Paypal, dont la stratégie repose sur le phénomène de

marketing viral sont très fréquemment cités.

Certains articles portent plus précisément sur le concept de marketing viral sur le Web.

Récemment, Kaikati et Kaikati (2004) développent le concept de marketing furtif ancré sur le

principe selon lequel le bouche-à-oreille reste la forme de promotion la plus efficace. Selon

ces auteurs, les individus sont aujourd’hui bombardés de messages publicitaires qu’ils

détectent et ils développent des mécanismes de défense. Les marketers doivent donc utiliser

des méthodes plus subtiles pour communiquer un message aux consommateurs, comme le

marketing furtif qui consiste à présenter un nouveau produit en créant intelligemment un

« buzz » de manière clandestine. Plusieurs techniques marketing sont proposées par les

auteurs dans le cadre du marketing furtif : le marketing viral, les « pousseurs de marque »

(acteurs novices s’approchant de personnes dans des situations de vie réelle en leur glissant

des messages commerciaux dans des bars branchés, des magasins de musique), le marketing

célébrité (des célébrités sont embauchées par des laboratoires pharmaceutiques pour discuter

et mentionner certains médicaments), le marketing dans les jeux vidéo (faire apparaître les

5

Page 6: Modélisation du comportement viral des internautes lors de ...

marques ou les logos pour les renforcer) et enfin le marketing dans la musique Rap et Pop. Le

marketing viral a été analysé sous l’angle du consommateur-vendeur par Helm (2000) qui

souligne l’idée selon laquelle de nombreuses entreprises essaient d’utiliser sur le Web les

réseaux de communication de leurs propres consommateurs pour promouvoir et distribuer

leurs produits. L’expansion d’Internet ouvre également de nouvelles perspectives en ce qui

concerne le bouche à oreille. Certains sites (Walmart, Chase Manhattan Bank, Toys ‘R’ Us)

proposent des espaces de discussion sur les produits et les services multipliant ainsi les effets

du bouche-à-oreille. L’entreprise a donc intérêt à utiliser ces interactions entre internautes.

Helm (2000) définit le marketing viral comme un concept de communication et de

distribution qui repose sur des consommateurs transmettant des produits digitaux par e-mail à

d’autres consommateurs potentiels de leur sphère sociale et animant ces contacts pour que

ceux-ci transmettent aussi les produits à d’autres. L’auteur décrit les trois caractéristiques

d’une stratégie de marketing viral efficace : le produit est proposé gratuitement uniquement

sur le Net et pas dans les autres circuits de distribution (les très faibles coûts fixes sur Internet

favorisent la distribution gratuite des produits, le coût marginal pour une unité supplémentaire

est proche de zéro); l’offre contient une réelle valeur ajoutée ; les premiers contacts sont

choisis avec précaution. Helm (2000) distingue également les stratégies de marketing viral

avec forte ou faible intégration du consommateur. Dans un article provocateur, Dye (2000)

montre que le marketing viral n’obéit pas aux cinq mythes suivants pourtant très répandus: les

produits à scandale ne sont pas les seuls produits intéressants à promouvoir par bouche-à-

oreille (certains médicaments peuvent créer un bouche-à-oreille très fort); le buzz n’arrive pas

tout seul mais est plutôt le résultat d’actions marketing bien organisées ; les meilleurs

déclencheurs de buzz ne sont pas les meilleurs consommateurs (certains « contre culture »

peuvent déclencher un buzz); pour profiter de l’effet d’un buzz, on ne doit pas agir en premier

et vite (certains « copieurs » peuvent tirer des profits substantiels s’ils savent quand créer le

buzz) ; les media et de la publicité ne sont pas nécessaires pour créer un buzz. Présentant une

approche différente, Phelps et al. (2004) s’intéressent aux motivations de l’internaute à faire

passer un email à un autre internaute, ainsi qu’au comportement qui résulte de ces

motivations. Gruen et al. (2006) analysent l’impact du bouche-à-oreille sur Internet sur la

valeur et la fidélité du consommateur.

Cette synthèse de la littérature sur le bouche-à-oreille et le marketing viral montre par

conséquent que peu de recherches académiques portent sur l’étude du comportement viral des

internautes, en particulier dans les jeux promotionnels en ligne, ce que nous nous proposons

6

Page 7: Modélisation du comportement viral des internautes lors de ...

d’étudier dans cet article. Nous décrivons dans la deuxième partie ci-dessous les jeux

promotionnels en ligne de la société Expedia que nous avons utilisés.

MECANISME DES JEUX PROMOTIONNELS EN LIGNE ETUDIES

Nous avons analysé dans cette recherche trois jeux promotionnels organisés par la société

1000Mercis, leader en France du marketing interactif, pour son client Expedia, leader mondial

du voyage en ligne. Le premier jeu promotionnel a été organisé par la société Anyway, filiale

d’Expedia. Anyway commercialise des vols internationaux et domestiques, des séjours et des

circuits, des idées de week-end, des séjours à thèmes, des réservations hôtelières et des

locations de voiture. L’opération « Le Ciel est à tout le monde » menée par Anyway est un jeu

promotionnel en ligne à caractère viral qui s’est déroulé entre le 10 Mai et le 8 Juin 2004 (soit

une durée de 30 jours). L’un des objectifs d’Anyway était de relancer le trafic sur le site,

d’accroître les ventes et de recruter 200 000 participants. La mécanique du jeu promotionnel

utilisé était la suivante: l’internaute s’inscrit sur la page d’accueil du jeu ; il choisit ensuite son

avion parmi 7;son avion s’envole et atterrit sur la mappemonde; s’il se pose sur la destination

pour laquelle joue le joueur, il a gagné 2 billets d’avion pour cette destination; sinon, il a

perdu. Pour retenter sa chance, le participant doit répondre à une question soit de qualification

(socio-démographique ou comportement de voyage), soit virale (donner l’adresse e-mail d’un

ami pour lui envoyer une e-card et lui proposer de découvrir le jeu). Les dotations mises en

jeu correspondent à 30 billets d’avion aller retour pour deux personnes, soit un gagnant par

jour. Ce jeu a été un succès: 214,768 joueurs sur l’ensemble des 30 jours de jeu; 561 535

visites sur 30 jours de jeu; une durée moyenne de visite de 7 minutes 48 secondes, 10 834 075

de pages vues. Devant ce succès, la société Expedia a renouvelé ce type d’opération mais sur

la marque Expedia cette fois-ci. Le premier jeu Expedia 1, organisé du 25 Juin au 29

septembre 2004, a attiré 1 037 708 joueurs, le deuxième, Expedia 2, du 16 novembre au 15

décembre 2004, a eu 916 853 participants. La mécanique des deux jeux est similaire à celle du

jeu d’Anyway ci-dessus décrit, à savoir une dotation (un voyage à gagner), un jeu (le principe

ici était de gratter avec la souris de l’ordinateur et certains objets, différents selon les jeux et

l’avancement des questions, devaient apparaître), et un questionnaire soumis au joueur s’il a

perdu et s’il souhaite rejouer. Les questions sont de deux types: des questions de qualification,

généralement sur le comportement de l’internaute vis-à-vis des voyages, des questions

« virales » pour lesquelles le joueur doit fournir une ou plusieurs adresses email de ses amis

ou connaissances.

7

Page 8: Modélisation du comportement viral des internautes lors de ...

MODELISATION DU POTENTIEL VIRAL DES INTERNAUTES

Définition du potentiel viral et résultats descriptifs

Dans une première partie de cette recherche, nous définissons le potentiel viral et essayons de

mieux comprendre le phénomène viral.

Au préalable, il est nécessaire d’introduire différents éléments permettant de décrire le

phénomène viral. Nous définissons l’enfant comme un individu dont l’adresse email a été

fournie par un joueur. Un parent est un joueur qui fournit l’adresse email d’un enfant. Un

ancêtre est un parent qui n’est l’enfant de personne. Une tribu est une chaîne parents-enfants

composée d’un ancêtre et de tous les enfants générés, jusqu’au dernier, qui n’est le parent de

personne. Une tribu est constituée de plusieurs générations (La génération 0 correspond aux

ancêtres, la génération 1 aux enfants générés par les ancêtres, la génération 2 aux enfants

générés par la génération 1 qui sont devenus eux-mêmes parents, etc…). Un enfant direct est

un enfant séparé de son parent par une seule génération. Nous avons dans un premier temps

mesuré le phénomène de « boucles » (lorsqu’un joueur fournit une adresse email déjà

existante dans la base). Ces boucles représentent en moyenne 3% des adresses saisies. Nous

les avons ensuite exclues des données pour ne garder que le phénomène de génération de

nouvelles adresses grâce au mécanisme viral.

Le tableau 1 fournit quelques résultats synthétiques sur les effets viraux par génération.

Insérer Tableau 1: Effet viral par génération

Le tableau 1 montre que nous avons dans les données 160 756 ancêtres parmi lesquels 84 246

(soit 52,4%) deviennent eux mêmes à leur tour parents, fournissant en moyenne chacun 3,6

adresses email. Ces 84 246 joueurs génèrent 303 541 enfants (adresses email) parmi lesquels

16 650 (soit 5,5 %) deviennent parents, donnant chacun en moyenne 3,12 adresses. Les

résultats de la table 1 montrent que le jeu génère au maximum 9 générations (les ancêtres

correspondant à la génération G0). On constate que160 756 ancêtres génèrent 370 755 enfants

(531 511-160 756), ceci correspondant au nombre de nouvelles adresses email générées par le

jeu, et 21 991 nouveaux parents (adresses email qui « viralisent »). En moyenne 20% des

enfants deviennent parents avec une forte hétérogénéité parmi les générations (52,4% pour les

ancêtres et entre 3% et 11% pour les générations suivantes).

Nous définissons ensuite le potentiel viral des ancêtres comme le potentiel de fournir un grand

nombre d’enfants et de “bons” enfants, c’est à dire des enfants qui deviennent eux-mêmes

parents par la suite. Nous utilisons trois critères pour caractériser le potentiel viral des

ancêtres: le nombre total d’enfants générés dans la tribu, le nombre de générations dans la

8

Page 9: Modélisation du comportement viral des internautes lors de ...

tribu, le nombre d’enfants directs. Le tableau 2 fournit les statistiques descriptives de ces trois

facteurs.

Insérer Tableau 2: statistiques sur les trois caractéristiques du potentiel viral Le tableau 2 montre que 90% des tribus génèrent jusqu’à 10 enfants en une ou deux

générations. Ceci signifie que dans la majorité des cas, le potentiel viral est peu lié au critère

de nombre de générations mais surtout au critère nombre d’enfants directs. On note également

un groupe spécifique de 10% des ancêtres qui fournissent plus de 10 adresses email dans la

tribu et ce sur plusieurs générations. Pour aller plus loin et synthétiser cette analyse, nous

avons donc mené une segmentation des ancêtres fondée sur leur potentiel viral. Nous utilisons

une segmentation (k-means) à partir des trois critères ci-dessus décrits (nombre total d’enfants

dans la tribu, nombre de générations, nombre d’enfants directs). Les résultats sont présentés

dans le tableau 3.

Insérer Tableau 3: Segmentation des ancêtres selon leur potentiel viral Le tableau 3 montre trois groupes d’ancêtres. Nous avons appelé le premier groupe les

“Stériles”. Ils représentent 47,6% des ancêtres et n’ont généré aucun enfant. Un second

groupe (48,9% des ancêtres) est constitué des paresseux générant 2,99 enfants dans leur tribu

en 1,17 génération en moyenne. Le dernier groupe est celui des “Fertiles” (3,5% des ancêtres)

avec 24 enfants générés en 1,8 générations en moyenne. Ce dernier groupe est bien

évidemment le plus intéressant pour les praticiens du marketing car ces internautes ont le plus

fort potentiel viral. Une analyse des profils montre que ce groupe est plus jeune et plus

féminin que les deux premiers. La description du phénomène ci-dessus nous amène à tirer

plusieurs conclusions. Tout d’abord, le phénomène viral se concentre principalement sur une

génération (les internautes donnent une adresse email). Il est donc utopique d’affirmer que les

joueurs génèrent de longues et successives chaînes parents-enfants. La réalité est que ce

phénomène concerne un pourcentage faible des internautes (ici les fertiles ne représentent que

près de 4% des ancêtres). Ceci rend d’autant plus important la détection d’internautes à fort

potentiel viral pour optimiser les opérations de marketing viral.

9

Page 10: Modélisation du comportement viral des internautes lors de ...

Application des réseaux Bayésiens pour prédire le potentiel viral des internautes

Après la description du phénomène viral, nous cherchons à mieux comprendre les facteurs

permettant de prédire le potentiel viral des joueurs. Nous proposons ici d’appliquer les

réseaux Bayésiens qui répondent à cette problématique en recherchant parmi un nombre élevé

de variables celles dont l’information nous permet de prédire le mieux possible la

connaissance du potentiel viral du joueur.

Les réseaux Bayésiens

Les nouvelles technologies comme Internet permettant de recueillir et de stocker de

nombreuses informations, se pose la question essentielle de l’analyse et de la synthèse de ces

informations. Deux types d’approches suscitent donc un intérêt croissant. Les méthodes

statistiques d’une part, permettant notamment le passage de l’observation à la loi.

L’intelligence artificielle d’autre part, permettant de traiter davantage la connaissance que

l’information. Les réseaux Bayésiens sont le résultat d’une convergence entre ces deux

disciplines. Ils constituent aujourd’hui l’un des formalismes les plus complets pour

l’acquisition, la représentation et l’utilisation de connaissances par des ordinateurs (Naïm et

al. 2004). La méthodologie des réseaux Bayésiens a été initialement développée pour

modéliser le raisonnement humain. Elle se fonde sur les probabilités conditionnelles. Si les

variables X and Y ne sont pas indépendantes, la probabilité de X sachant Y est la probabilité

conditionnelle suivante :

P(X|Y) = P(X,Y) / P(Y)

En utilisant la même équation pour calculer la probabilité de Y sachant X, on obtient la

formule de Bayes suivante:

P(X|Y) = P(Y|X) P(X) / P(Y)

Cette formule exprime le principe d’interdépendance d’évènements arrivant dans le monde

réel. Dans les réseaux bayésiens, les relations entre plusieurs variables sont investiguées. Les

réseaux Bayésiens (Pearl, 1988) sont des graphes acycliques orientés représentant les relations

causales entre plusieurs variables d’un domaine donné. La topologie du graphe définit les

relations d’indépendance conditionnelle parmi les variables du réseau. La probabilité de se

trouver dans un état particulier d’un nœud est conditionné aux états des nœuds « causes »

(parents). La force des relations causales entre les nœuds est exprimée par une probabilité

conditionnelle (Falzon, 2006). Un réseau Bayésien est donc un graphe causal auquel on a

associé une représentation probabiliste sous-jacente. Une représentation simple d’un réseau

Bayésien est présentée dans la Figure 1.

10

Page 11: Modélisation du comportement viral des internautes lors de ...

Insérer Figure 1: Exemple simple de réseau Bayésien

La figure 1 montre que le nœud C est parent des nœuds E et F et enfant du nœud A. Ceci

signifie que l’état du noeud F est conditionné à l’état du noeud C, lui même conditionné à

celui du nœud A. Pour chaque nœud, une distribution de probabilité doit être spécifiée.

L’avantage de cette représentation graphique est qu’elle permet la spécification de

dépendances directes représentant les relations qualitatives fondamentales (Falzon, 2006) et

ce sur plusieurs variable en même temps (la régression elle va s’intéresser à une variable

dépendante). Les probabilités conditionnelles nécessaires pour élaborer un réseau Bayésien

sont soit fournies par des experts (et fondées sur leur expérience), soit issues d’une base de

donnée. L’un des avantages des réseaux Bayésiens est alors lié à la définition des probabilités

conditionnelles (cf formule de Bayes ci-dessus décrite): la probabilité de X sachant Y est plus

simple à calculer grâce à cette formule que la probabilité jointe de X et Y. La détermination

des probabilités conditionnelles est également plus compatible avec le raisonnement humain

que l’estimation des probabilités absolues (Falzon, 2006). Un deuxième avantage des réseaux

Bayésiens est le fait qu’on peut changer les hypothèses (probabilités définissant les états pour

chaque nœud) et mesurer l’impact sur chaque autre nœud. Les réseaux Bayésiens offrent

également une représentation graphique du phénomène rendant plus simple la compréhension

de systèmes parfois complexes. Dans la littérature en marketing, très peu de recherches

utilisent les réseaux Bayésiens (Kao, Hyuang and Li 2005; Mussi 2003; Cooper 2003). Nous

visons dans cet article à montrer les bénéfices de cette méthodologie et les pistes de recherche

potentielles liées à l’application des réseaux Bayésiens au domaine du marketing.

Application des réseaux Bayésiens pour prédire le potentiel viral La figure 2 représente l’application des réseaux Bayésiens aub jeu promotionnel on line.

Insérer Figure 2: Application des réseaux Bayésiens au jeu Chaque noeud de la figure 2 représente une variable de la base de données sélectionnée. Cette

base est constituée des variables décrivant les 84 246 ancêtres. Ces variables dans une

première analyse sont le type de recrutement (affiliation, email, autopromotion, etc…), le

montant total des achats (sur une durée de 1 an après le jeu), le nombre de générations, le

nombre d’enfants directs, le nombre total d’enfants dans la tribu, la modalité de réponse pour

chacune des 41 questions posée dans le jeu. Une première analyse du réseau a bien

évidemment validé le fait que le nombre total d’adresses virales générées par la tribu est lié au

nombre d’enfants directs, au nombre de générations et au fait d’avoir répondu aux questions

11

Page 12: Modélisation du comportement viral des internautes lors de ...

virales (résultat évident). Nous avons donc par la suite supprimé de la base de données les

informations de réponses aux questions virales et les variables nombre de générations et

nombre d’enfants directs. L’idée ici est en effet de déterminer si on peut prédire un potentiel

viral sans avoir d’information sur le comportement viral de l’internaute mais uniquement à

partir d’informations issues de questions de qualification. La figure 2 montre le réseau

Bayésien associé à cette dernière base de données. Plus de 4,5 millions d’informations sont

inclues dans la base de données (84 246 ancêtres x 54 variables). Le noeud SUM correspond à

la variable nombre total d’enfants générés dans la tribu, qu’on cherche donc ici à prévoir. Le

premier avantage des réseaux Bayésiens est ici de simplifier l’interprétation d’une telle base

de données en construisant un graphe (figure 2) montrant toutes les relations entre les

variables de la base.

Le deuxième avantage des réseaux Bayésiens est de pouvoir sélectionner un nœud cible et

d’effectuer un certain nombre d’analyses sur ce nœud cible. Nous cherchons ici à prédire la

variable SUM. Pour cela, nous sélectionnons dans le graphe le nœud SUM et le définissons

comme nœud cible. On peut ensuite caractériser ce noeud cible. Cette caractérisation repose

sur un ensemble d’algorithmes et sur l’apprentissage du réseau Bayésien (estimation des

probabilités conditionnelles et recherche de la meilleure structure de réseau). Nous utilisons

ici, pour prévoir la variable SUM, la couverture de Markov, développée uniquement dans le

logiciel BayesiaLab (ce logiciel a été développé par des chercheurs spécialisés dans les

réseaux Bayésiens). Elle repose sur un algorithme de recherche des nœuds appartenant à la

couverture de Markov de la cible, sous-ensemble de nœuds dont la connaissance des valeurs

permet de rendre le nœud cible complètement indépendant des autres. La recherche de cette

structure, entièrement focalisée sur le nœud cible, permet d’obtenir le sous-ensemble des

nœuds réellement pertinents pour prévoir la variable cible SUM. Cette méthode constitue en

outre un puissant algorithme de sélection de variables et un bon outil d’analyse (nombre

restreint de nœuds connectés, relations probabilistes). La figure 3 fournit les résultats de la

couverture de Markov sur le nœud SUM.

Insérer Figure 3: Couverture de Markov sur le noeud SUM

On conclut de la figure 3 que la connaissance des réponses des individus aux questions de

qualification Q5, Q15 (modalités1501 ou 1502), Q19 (modalité1903), Q17 (modalités1702 ou

1703), Q12 (modalité1202), Q9 (modalité 901) permet de prévoir le nombre d’adresses

virales générées dans la tribu. L’application managériale de ces résultats est directe : en

12

Page 13: Modélisation du comportement viral des internautes lors de ...

posant préalablement au jeu les questions Q5, Q15, Q17, Q9 et Q12 (par exemple lors du

recrutement), la réponse à ces questions nous permet de prévoir le potentiel viral de

l’internaute. Ces questions sont uniquement des questions de qualification (cf questionnaire

en annexe 1).

Performance du modèle des réseaux Bayésiens

La performance du réseau bayésien est fourni par la figure 4 ci-dessous :

Insérer figure 4 :Performance du modèle : matrice de confusion

La figure 4 montre que le modèle prédit correctement la valeur SUM dans 86,4% des cas

(comparaison prédictions du modèle versus données observées). La matrice de confusion

fournit de plus le détail des prévisions du modèle pour chacune des quatre tranches de la

variable SUM. On constate que le modèle prévoit très bien la variable SUM pour chaque

tranche de la variable SUM (le plus bas taux est 76,6%). Les réseaux Bayésiens présentent

plusieurs avantages par rapport à des méthodologies plus classiquement utilisées en

marketing.Une comparaison entre les modèles de régression, les équations structurelles et les

réseaux Bayésiens est développée par Anderson, Mackoy , Thompson ad Harrell (2004). Une

autre comparaison des réseaux Bayésiens avec les réseaux neuronaux, les arbres de décision,

l’analyse de données et les systèmes experts est fournie par Naïm et al. (2004). Dans les deux

cas, les auteurs mettent en avant les avantages des réseaux Bayésiens par rapport à ces autres

méthodes.

IMPLICATIONS ET FUTURES PISTES DE RECHERCHES:

Les implications de cette recherche sont nombreuses. Tout d’abord, elle permet de mieux

comprendre les phénomènes de marketing viral en décomposant le système viral sur plusieurs

générations d’internautes, en définissant puis en étudiant le potentiel viral des ancêtres

initiateurs de la chaîne virale. D’autre part cette recherche introduit une méthode innovante en

marketing, les réseaux Bayésiens, qui montrent dans notre application qu’on peut prévoir le

potentiel viral des internautes par quelques questions de qualification dans le domaine

considéré (ici les voyages). Plus globalement, l’application des réseaux Bayésiens ouvre de

nombreuses pistes de recherche en marketing, ce type de modélisation n’ayant quasiment pas

été utilisé dans ce domaine. Plusieurs problématiques marketing peuvent être modélisées par

cette méthode :

13

Page 14: Modélisation du comportement viral des internautes lors de ...

- Recherche de variables clés explicatives d’une variable dépendante dans une base

de données regroupant un nombre élevé de variables et d’individus (donc de

nombreuses applications possibles en marketing)

- Analyse des résultats de questionnaires avec construction éventuelle de

questionnaires adaptatifs

- Optimisation des questionnaires (quel est dans un questionnaire le sous-ensemble

des questions dont la connaissance des réponses nous permet de prédire les

réponses aux autres questions ?)

Sur le plan managérial, l’intérêt des réseaux Bayésiens est la visualisation simple et la

modélisation compréhensible qu’ils proposent.

CONCLUSION :

Face à la complexité de certains phénomènes liés aux nouvelles technologies, les praticiens

en marketing doivent utiliser des systèmes d’aide à la décision compréhensibles et simples à

utiliser. Les phénomènes de marketing viral, pourtant souvent considérés comme

particulièrement efficaces et peu chers, sont des systèmes complexes à comprendre

aujourd’hui. Nous avons dans cette recherche essayé de mieux comprendre ces phénomènes

viraux dans un premier temps. Nous avons également proposé une méthode innovante ne

marketing pour prévoir le potentiel viral des internautes. Cette méthode, les réseaux

Bayésiens, permet de modéliser des systèmes complexes en les simplifiant grâce à la

visualisation et au calcul de toutes les relations entre toutes les variables décrivant un

phénomène. Ces réseaux Bayésiens permettent une meilleure compréhension de phénomènes

complexes mais aussi une optimisation des actions marketing, comme nous l’avons montré

sur le cas du jeu promotionnel viral étudié où le recrutement des joueurs pourrait être optimisé

de par la connaissance des réponses de ces mêmes joueurs à quelques questions de

qualification. L’application des réseaux Bayésiens au domaine du marketing constitue une

source importante de pistes de recherche futures.

14

Page 15: Modélisation du comportement viral des internautes lors de ...

REFERENCES

Ansari,A. et Mela C.F. (2003), E-customization, Journal of Marketing Research, 40, 2,

131-145.

Arndt J. (1968), Selective Processes in Word of Mouth, Journal of Advertising Research, 8,

3, 19-23.

Bansal H.S. et Voyer P.A. (2000), Word-of-Mouth Processes within a Services Purchase

Decision Context, Journal of Service Research, 3, 2, 166-177.

Bowman D. et Narayandas D.(2001), Managing Customer-Initiated Contacts with

Manufacturers: The Impact on Share of Category Requirements and Word-of-Mouth

Behavior, Journal of Marketing Research, 38, 3, 281-297

Bristor J.M. (1990), Enhanced explanations of word of mouth communications: the power of

Relationships,Research in Consumer Behavior, 4, 51-83.

Brown J.J. et Reingen P.H. (1987), Social ties and word-of-mouth referral behavior, Journal

of Consumer Research, 14, 350-62.

Dye R. (2000), The buzz on buzz, Harvard Business Review, 78, 6, 139-147.

Gruen T., Osmonbekov T. et Czaplewski A.J. (2006), eWOM: The impact of customer-to-

customer online know-how exchange on customer value and loyalty, Journal of Business

Research, 59, 4, 449-456.

Helm S. (2000), Viral marketing-establishing customer relationships by “word-of-mouse”,

Electronic Markets, 10,3, 158-161.

Kaikati A.M. et Kaikati J.G. (2004), Stealth marketing : How to reach consumers

Surreptitiously, California Management Review, 4, 4, 6-22.

Lynch J.G. Jr. et Ariely D. (2000), Wine online: Search costs affect competition on price,

quality, and distribution, Marketing Science, 19,1, 83-103.

Mandel N. et Johnson E.J. (2002), When Web pages influence choice: Effects of visual

primes on experts and novices, Journal of Consumer Research, 29, 2, 235-245.

Marney Jo (1995), Selling in Tongues, Marketing Magazine, 100, 38, 14.

Moe W.W. et Fader P.S. (2004a), Capturing evolving visit behavior in clickstream data,

Journal of Interactive Marketing, 18,1, 5-19.

Moe W.W. et Fader P.S. (2004b), Dynamic conversion behavior at e-commerce sites.

Management Science, 50,3, 326-335

Money R. B., Gilly M.C. et Graham, J.L. (1998), Explorations of National Culture and Word-

of-Mouth Referral Behavior in the Purchase of Industrial Services in the United States and

15

Page 16: Modélisation du comportement viral des internautes lors de ...

Japan, Journal of Marketing, 62, 4, 76-87.

Park Y.H.et Fader P.S. (2004), Modeling browsing behavior at multiple Websites,

Marketing Science, 23,3, 280-304.

Phelps J.E., Lewis R., Mobilio L., Perry, D. et Raman, N. (2004), Viral Marketing on

Electronic Word-of-Mouth Advertising: Examining Consumer Responses and Motivations to

Pass Along Email, Journal of Advertising Research, 44, 4, 333-348.

Silverman G. (1997), Harvesting the power of word of mouth, Potentials in Marketing, 30,

9, 14-16.

Sismeiro C.et Bucklin R.E. (2004), Modeling purchase behavior at an e-commerce Web

site: A task completion approach, Journal of Marketing Research, 41,3, 306-323.

Tax S.S., Chandrashekaran M. et Christiansen T. (1993), Word-of-mouth in consumer

decision-making: an agenda for research, Journal of Customer Satisfaction, Dissatisfaction

& Complaining Behavior, 6, 75-80.

Walker L. J.H. (2001), The Measurement of Word-of-Mouth Communication and an

Investigation of Service Quality and Customer Commitment as Potential Antecedents.

Journal of Service Research, 4,1, 60-75.

Zauberman G. (2003), The intertemporal dynamics of consumer lock-in, Journal of

Consumer Research, 30,3, 405-419.

16

Page 17: Modélisation du comportement viral des internautes lors de ...

Tableau 1: Effet viral par génération

Nbre Nbre de % Conversion Nbre de % Conversion Nbre d'enfants d'enfants joueurs en joueurs* parents en parents** directs / parent

G0 (ancêtres) 160756 160756 100 G0PAR 84246 52,41 3,60G1 303541 32480 10,70 G1PAR 16650 5,49 3,12G2 51875 7815 15,07 G2PAR 3932 7,58 3,00G3 11811 2028 17,17 G3PAR 1029 8,71 3,06G4 3148 605 19,22 G4PAR 333 10,58 1,00G5 333 70 21,02 G5PAR 36 10,81 1,00G6 36 9 25,00 G6PAR 7 19,44 1,00G7 7 3 42,86 G7PAR 3 42,86 1,00G8 3 1 33,33 G8PAR 1 33,33 1,00G9 1 0 0,00 0 0,00

TOTAL 531511 203767 38,34 106237 19,99

*% Conversion en joueurs = nbre d'enfants de la génération qui deviennent joueurs ** % Conversion en parents = nbre d'enfants générés par la génération n-1 qui deviennent parents

(données traitées sans boucle)

Tableau 2: Statistiques sur les trois caractéristiques du potentiel viral

Statistics

84246 84246 842460 0 0

4,40 1,21 3,607,169 ,546 5,704

51,389 ,298 32,5311 1 1

240 9 2401,00 1,00 1,001,00 1,00 1,001,00 1,00 1,002,00 1,00 2,002,00 1,00 2,003,00 1,00 2,00

ValidMissing

N

MeanStd. DeviationVarianceMinimumMaximum

10203040506070 4,00 1,00 3,00

6,00 1,00 4,008010,00 2,00 8,009011,00 2,00 8,009111,00 2,00 9,009213,00 2,00 10,009314,00 2,00 11,009416,00 2,00 12,009518,00 2,00 14,009621,00 3,00 16,009725,00 3,00 19,0098

99 33,00 3,00 25,00

Percentiles

Nb ad virsaisies partte la tribu

Nb degénérations

Nb de filleulsdirects

17

Page 18: Modélisation du comportement viral des internautes lors de ...

Tableau 3: Segmentation des ancêtres selon leur potentiel viral

Figure 1: Exemple simple de réseau Bayésien

A

D E F

B C

Stériles Paresseux FertilesNbre de générations 0 1,17 1,80

Nbre d'enfants directs 0 2,55 18,30Total nbre d'enfants générés par la tribu

% total ancêtres 47,59 48,91 3,50

0 2,99 24,12

18

Page 19: Modélisation du comportement viral des internautes lors de ...

Figure 2: Application des réseaux Bayésiens au jeu

19

Page 20: Modélisation du comportement viral des internautes lors de ...

igure 4: Performance du modèle : matrice de confusion

Figure 3: Couverture de Markov sur le noeud SUM

F

20

Page 21: Modélisation du comportement viral des internautes lors de ...

ANNEXE 1 : QUESTIONNAIRE DU JEU Questionnaire du jeu

Q 1 V o u s v iv e zE n c o u p le s a n s e n fa n t

S e u l(e ) s a n s e n fa n t

E n c o u p le a v e c e n fa n t(s )

S e u l(e ) a v e c e n fa n t(s )

C h e z v o s p a re n ts

1 0 1 1 2 3 4 5

Q 2

A c tu e lle m e n t, v o u s ê te s

E tu d ia n t(e ), ly c é e n (n e ) , c o llé g ie n (ne )

S a la r ié (e ) s e c te u r p r iv é

T ra v a ille ur ( s e ) in d é p e n da n t(e )

F o n c t io n na ir e

E n re c h e r c h e d 'e m p lo i

H /F a u fo y e r

R e t ra ité (e ) A u t re

2 0 1 1 2 3 4 5 6 7 8

M e r c i d e p r é c is e r s i v o u s ê te s .. . A g r ic u lte u r A r t is a nC o m m e rça n t

C h e f d 'e n tr e p r is e C a d re

C a d re s u p é r ie u r

E n s e ig n an t

P ro fe s s ion lib é r a le E m p lo y é O u v r ie r A u tr e

2 0 2 1 2 3 4 5 6 7 8 9 1 0

Q 3C o m b ie n d e v o

1 1

y a g e (s ) a lle r - re to u r a v e z -v o u s e f fe c tu é ( s ) a u c o u rs d e s 1 2 d e rn ie rs m o is ?

A u c u n 1 2 3 4 5 6 à 1 0 1 1 à 2 02 1 e t p lu s

3 0 1 E n a v io n p o u r d e s r a is o n s p e rs o n n e lle s 1 2 3 4 5 6 7 8 93 0 2 E n a v io n p o u r d e s r a is o n s p r o fe s s io n n e lle s 1 2 3 4 5 6 7 8 9

Q 4 V IR A L

Q 5 E n g é n é ra l, p o u r v o s v o y a g e s e n a v io n , v o u s r é s e r v e z …M o in s d e 3 jo u r s à l'a v a n c e

E n tr e 3 e t 6 jo u rs à l'a v a n c e

E n tr e u n e s e m a in e e t u n m o is à l'a v a n c e

E n tre u n m o is e t 2 m o is à l'a v a n c e

P lu s d e 2 m o is à l'a v a n c e

Je n e r é s e r v e p a s d e b ille ts d 'a v io n

5 0 1 1 2 3 4 5 6

Q 6Q u e l e s t l'a é r o p o r t d e d é p a r t q u e v o u s u t ilis e z le p lu s f ré q u e m m e n t ?

6 0 1 m e n u d é ro u la n t , v o ir o n g le t c o r re s p o n d a n t

Q 7 Q u a n d p ré v o y e z -v o u s d e p a r t ir e n v o y a g e e n a v io n ?E n m a i o u ju in 2 0 0 4

E n ju ille t 2 0 0 4

E n a o û t 2 0 0 4

E n s e p te m b re 2 0 0 4 o u p lu s ta r d

p ré v o is p a s d e p a r t ir e nv o y a g e e n a v io n

Je n e

7 0 1 1 2 3 4 5

O ù s o u h a ite z v o u s p a r t ir p o u r v o t re p r o c h a in v o y a g e e n a v io n ?E n F r a n c e m é tr o p o lita in e

E n E u ro p e d u S u d

D a n s le re s te d e l'E u ro p e

A u M o y e n O r ie n t

A u x C a ra ib e s

D a n s l'O c é a n I n d ie n

E n A m é r iq u e d u N o rd

E n A m é r iq u e la t in e

E n A fr iq u e d u N o rd

D a n s le r e s te d e l'A f r iq u e

E n A s ie

7 0 2 1 2 3 4 5 6 7 8 9 1 0 1 1

Q 8 V IR A L

Q 9 Q u e lle p a r t d e v o s v o y a g e s a c h e te z -v o u s s u r I n te rn e t ?

Je n 'e n a i ja m a is a c h e té s u r I n te rn e t

M o in s d 'u n q u a r t

E n tr e u n q u a r t e t la m o it ié

E n t re la m o it ié e t le s t ro is q u a r ts

P lu s d e s tr o is q u a r ts

9 0 1 P o u r d e s b ille ts d 'a v io n p e r s o n n e ls 1 2 3 4 59 0 2 P o u r d e s b ille ts d 'a v io n p r o fe s s io n n e ls 1 2 3 4 5

Q 1 0A u c o u rs d e s 1 2 d e rn ie rs m o is , c o m b ie n d e s é jo u r ( s ) e n h ô te l a v e z -v o u s e f fe c tu é ?

A u c u n 1 2 3 4 5 6 e t p lu s

1 1 0 1 p o u r d e s ra is o n s p e r s o n n e lle s 1 2 3 4 5 6 71 1 0 2 p o u r d e s ra is o n s p r o fe s s io n n e lle s 1 2 3 4 5 6 7

21

Page 22: Modélisation du comportement viral des internautes lors de ...

modalité réponse

Question Condition Intitulé des questions

Q11 VIRAL

Q12Combien de fois avez-vous loué une voiture au cours des 12 derniers mois ?

Aucun

1 2 3 4 56 à 10

11 à 20

21 et plus

1201 Pour des raisons personnelles 1 2 3 4 5 6 7 8 91202 Pour des raisons professionnelles 1 2 3 4 5 6 7 8 9

Q13Pourquoi quelle(s) raison(s) n'achetez vous pas vos voyages personnels sur Internet ? (Plusieurs réponses possible)

1301 Q901=1 Achat en agence de voyage1302 Q901=1 Prix trop chers1303 Q901=1 Délais de livraison trop importants1304 Q901=1 Paiements pas suffisament sécurisés1305 Q901=1 Données non confidentielles1306 Q901=1 Plaintes ou réclamations difficiles1307 Q901=1 Problème de connexion Internet1308 Q901=1 Autres1309 Q901=1 Je n'achète pas personnellement de voyage

1399 Q901<>1 VIRAL

Q14Au cours des 12 derniers mois, combien de séjours à l'étranger avez-vous effectué pour des raisons personnelles

Je n'ai effect

1 2 3entre 4 et 6

plus de 6

1401 Des séjours courts (1 à 4 jours) 1 2 3 4 5 61402 Des séjours d'une semaine 1 2 3 4 5 61403 Des séjours de plus d'une semaine 1 2 3 4 5 6

Q15 Où êtes-vous parti ces 12 derniers mois ?En France

En Euro

Dans le reste

Au Moyen

Aux Caraibes

Dans l'Océan

En Améri

Dans le reste

En Asie

En Océanie

Je ne sais

22

Q25 En général, vous partez en voyagePendant les

Hors vacances

Cela dépend,

2501 1 2 3

Q26 Q201<>(5,6,7) Dans quel secteur travaillez-vous ? (menu déroulant)Agriculture /

Architecture /

Automobile /

Energie / Chimi

Finance / Banq

Droit / Juridi

Conseil / Etude

Média / Com

Informatique /

Santé / Phar

Transport / Logis

Grande distri

Commerces et

Loisirs / Touri

Arts / Culture

Enseignement /

Administration /

Autre

2601 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 182699 Q201 IN (5,6,7) VIRAL

Q27 Avez-vous déjà acheté des voyages sur les sites suivants : Oui Non

2701 Accorhotel 1 02702 Anyway.com 1 02703 Bourse des voyages 1 02704 Ebookers 1 02705 Govoyages.com 1 02706 Havas Voyages 1 02707 Karavel.com 1 02708 lastminute.com 1 02709 Nouvelles Frontières 1 02710 Opodo.fr 1 02711 Partirdiscount.com 1 02712 Promovacances.com 1 02713 Travelprice.com 1 02714 Vivacances.fr 1 02715 voyages-sncf.com 1 0

pe du que

En Amérique

En Afrique du pas

1501 Q301<>1 pour des raisons personnelles 1 2 3 4 5 6 7 8 9 10 11 12 131502 Q302<>1 pour des raisons professionnelles 1 2 3 4 5 6 7 8 9 10 11 12 131599 Q301=1 ET VIRAL

Q16 VIRAL

Q17Quelles sont les 3 compagnies aériennes que vous utilisez le plus souvent ? Air Fr Alitali Amer BritishBritishDelta Easy IberiaKLM LufthaRyanaSAS SwissAutres Compagni

1701 01<>1 ou Q302< choix 1 1 2 3 4 5 6 7 8 9 10 11 12 13 141702 01<>1 ou Q302< membre du programme de fidélité 1 2 3 4 5 6 7 8 9 10 11 12 13 141703 01<>1 ou Q302< choix 2 1 2 3 4 5 6 7 8 9 10 11 12 13 141704 01<>1 ou Q302< membre du programme de fidélité 1 2 3 4 5 6 7 8 9 10 11 12 13 141705 01<>1 ou Q302< choix 3 1 2 3 4 5 6 7 8 9 10 11 12 13 141706 01<>1 ou Q302< membre du programme de fidélité 1 2 3 4 5 6 7 8 9 10 11 12 13 141799 Q301=1 ET VIRAL

Q18 Combien d'enfants avez-vous ? Aucu 1 2 3 4 51801 Q101 IN (2,4) Moins de 3 ans 1 2 3 4 5 61802 Q101 IN (2,4) Entre 3 et 7 ans 1 2 3 4 5 61803 Q101 IN (2,4) Entre 7 et 12 ans 1 2 3 4 5 61804 Q101 IN (2,4) Entre 12 et 18 ans 1 2 3 4 5 61805 Q101 IN (2,4) Plus de 18 ans 1 2 3 4 5 6

1899 Q101<>(2,4) VIRAL

Q19Quels sont les principaux critères qui interviennent dans votre choix pour acheter un billet d'avion (classement par ordre d'importance)

Le prix le

Vol direct

Horaires

Les services

La renommé

Vol en rom

L'existence

p d'un 1901 choix 1 1 2 3 4 5 6 71902 choix 2 1 2 3 4 5 6 71903 choix 3 1 2 3 4 5 6 7

Q20 VIRAL

Q21 Lorsque vous partez en vacances, vous préférez …Un séjour

Un séjour en

Un séjour en

Réserver un

Une croisière

Une thalassoth

Un séjour

Partir à l'ave

Aller dans votre

Aller chez des

Cela dépend

2101 1 2 3 4 5 6 7 8 9 10 11

Q22 Lorsque vous voyagez en avion, vous voyagez principalement…En premi

En class

En class

Je ne voya

2201 à titre personnel 1 2 3 42202 à titre professionnel 1 2 3 4

Q23 Q302<>1Qui s'occupe habituellement de réserver vos billets d'avion professionnels ?

Moi même

Un service

Une personne

2301 1 2 32399 Q302=1 VIRAL

Q24 VIRAL

Page 23: Modélisation du comportement viral des internautes lors de ...

Q28 VIRAL

Q29Si on vous offrait une nuit d'hôtel, dans quelleville réserveriez-vous?

2901 menu déroulant, voir onglet correspondant

Q30 Disposez-vous d'une connexion Internet à votre domicile?oui, bas débit

oui, haut débit

oui, mais ne connais pas le débit

je n'ai pas de connexion Internet à mon domicile

3001 1 2 3 4

Q31 Combien dépense votre foyer par an pour ses vacances ?

Moins de 762 € (5 000 F)

De 762 € (5 000F) à 1524 € (10 000 F)

De 1524 € (10 000 F) à 3048 € (20 000 F)

Plus de 3048 € (20 000 F)

Je ne souhaite pas répondre

3101 1 2 3 4 5

Q32 VIRAL

Q33Y a-t-il des règles générales édictées par votre entreprise qui conditionnent : Oui Non

3301 Le choix de la compagnie 1 03302 La classe de voyage 1 0

Q34 A quelle fréquence visitez-vous les sites suivants :

Vous n'y êtes jamais allé

Moins d'une fois par mois

Une fois par mois ou plus

3401 Accorhotel 1 2 33402 Anyway.com 1 2 33403 Bourse des voyages 1 2 33404 Ebookers 1 2 33405 Govoyages.com 1 2 33406 Havas Voyages 1 2 33407 Karavel.com 1 2 33408 lastminute.com 1 2 33409 Nouvelles Frontières 1 2 33410 Opodo.fr 1 2 33411 Partirdiscount.com 1 2 33412 Promovacances.com 1 2 33413 Travelprice.com 1 2 33414 Vivacances.fr 1 2 33415 voyages-sncf.com 1 2 3

Q35Avez-vous déjà choisi un billet d'avion uniquement parce qu'il était en promotion ?

Oui NonNe sais pas

3501 1 0 2

Q36 VIRAL

Q37 Vous vivez dans… Un appart Une maisoUne maison avec jardin3701 1 2 3

Q38 Q101<>5 Vous êtes… PropriétairLocataire3801 1 23899 Q101=5 VIRAL

Q39 Quel est le niveau d'étude le plus haut que vous ayez atteint? Collège Lycée Bac +1/2Bac + 3/4

Bac + 5 et plus

3901 1 2 3 4 5

Q40 VIRAL

Q41 Sur Internet, avez-vous déjà acheté? (plusieurs choix possibles)

4101 Du matériel ou des logiciels informatiques4102 Du matériel hifi/photo4103 Des billets de train, des location de voitures4104 Des voyages : séjours, thalassos, croisièrs,…4105 Des produits culturels (Livres, CD audio ou DVD)4106 Des billets pour des sorties, des spectacles4107 Des vêtements4108 Des produits de beauté4109 Des fleurs ou des plantes4110 Des produits alimentaires (courses en ligne)4111 Du vin4112 Des produits ou des services financiers4113 D'autres produits4114 Je n'ai jamais acheté sur Internet

23