Caracterización de consumidores ineficientes de energía ...
Transcript of Caracterización de consumidores ineficientes de energía ...
Caracterización de consumidores ineficientes de energía eléctrica: El Caso de
Bogotá y sus consumidores residenciales.
Por:
Camilo Andres Ariza Velasco
Facultad de Economía y Facultad de Administración
Universidad de los Andes
Asesor:
Mauricio Ruiz Valdivieso
Facultad de Administración
Resumen: En este documento se caracterizan los perfiles de los consumidores residenciales de
energía eléctrica en Bogotá más propensos a ser derrochadores de dicho servicio. Para lo anterior,
se definen los criterios que determinan cuándo el consumidor es derrochador; además, con base a
una muestra de datos de la Encuesta Multipropósitos de 2017 se modela el consumo de energía
mediante herramientas de estadísticas y de minería de datos. Específicamente, se consideran y/o
utilizan técnicas de segmentación como Clustering, Árboles de Clasificación, entre otras, que
permiten identificar las variables demográficas y comportamentales más dicientes de los tipos de
consumidor ineficiente o derrochador.
Clasificación JEL: M38
Palabras claves: clasificación, perfil, energía, cluster, CRISP.
Contenido
1. Introducción .................................................................................................................................1
2. Revisión de Literatura .................................................................................................................2
3. Marco Teórico ..............................................................................................................................4
CRISP-DM............................................................................................................................................... 4
Carga típica ............................................................................................................................................. 6
Cálculo de consumo per cápita utilizando el valor del recibo de energía eléctrica ........................... 6
Definición de Criterios de Caracterización .......................................................................................... 7
Criterios de Perfiles ..........................................................................................................................8
4. Marco empírico: Desarrollo de CRISP.DM ..............................................................................9
Comprensión del Problema .................................................................................................................... 9
Comprensión de datos y Preparación de datos .................................................................................. 10
Modelaje y Evaluación ......................................................................................................................... 11
Acción ..................................................................................................................................................... 14
5. Conclusión ................................................................................................................................. 15
6. Referencias ................................................................................................................................ 16
7. Anexos. ....................................................................................................................................... 18
1
Introducción El consumo residencial de energía eléctrica en Bogotá es ineficiente en tanto prevalecen los
comportamientos de derroche entre los consumidores, pues, el 35% del consumo de energía
eléctrica de los hogares que componen la muestra, es categorizado como derroche. En otras
palabras, en los hogares colombianos hay un consumo de energía superior al que, en teoría, se
requiere para satisfacer, simultáneamente, necesidades básicas, necesidades de recreación,
necesidades laborales/académicas de cada uno de los integrantes. Según entrevistas de primera
mano realizadas a trabajadores del área comercial de Codensa – Empresa comercializadora de
energía en Bogotá-, existe una abundancia de perfiles de consumidor derrochador que permanece
a pesar de las dinámicas sociales y ambientales a las que se enfrenta toda la sociedad. Según el
mismo trabajador de Codensa, lo anterior se debe a la ausencia de canales eficientes en la difusión
de políticas y acciones de responsabilidad social y concientización en esta área. Entonces, el
objetivo de este proyecto es caracterizar el perfil de aquellos consumidores derrochadores a partir
del descubrimiento de insights provenientes de la Encuesta Multipropósitos del 2017. Lo anterior,
con el fin de proponer lineamientos generales para estrategias de direccionamiento y de selección
de canales efectivos a la hora de difundir y efectuar políticas públicas de concientización o
responsabilidad social, que abordan el tema de ahorro y consumo eficiente de energía. En esta
medida, el uso de minería de datos permite desarrollar una solución al problema de las políticas y
campañas de concientización ineficientes, ya que, crea mejoras en las siguientes dimensiones:
- Identificación de aquellos que son derrochadores.
- Descripción de los perfiles de hogares derrochadores con el fin de diseñar mecanismos que
incentiven un consumo consiente y eficiente.
- Identificación de los canales más eficientes en la transmisión de mensajes de
concientización
Lo anterior es importante para la sociedad en tanto es necesario concientizar acerca del uso
responsable de los recursos escasos como el agua -principal fuente de energía en Colombia, y
demás combustibles fósiles que contaminan masivamente el medio ambiente. Específicamente, los
comportamientos de derroche y el consumo inconsciente generan una falsa demanda por energía
que las generadoras, distribuidoras y comercializadoras tienden a satisfacer. Para ello, se requiere
aumentar la capacidad de generación que, a su vez, produce efectos negativos en dinámicas
sociales, contaminación del aire, alteración de ríos y ecosistemas, desperdicio de agua y demás
afectaciones a recursos naturales vitales. Paralelamente, el uso eficiente de energía facilitaría la
transición a la generación de energías alternativas más limpias pues, un consumo consciente
disminuye la brecha entre la oferta de energía proveniente de fuentes alternativas limpias y la
demanda de energía total. En el caso de Bogotá, el impacto de direccionamiento eficiente de
campañas de concientización para los hogares es grande cuando se miran las cifras de la
participación de consumo de energía de dicha ciudad. Concretamente, en Colombia el 63% de la
energía se genera en hidroeléctricas, el 33% es de origen térmico con carbón, y el restante con
energías alternativas como la energía solar. Además, según la Comisión de Regulación de Energía
2
y Gas, solamente Bogotá representa el 25% del consumo total de energía del país; y de tal cantidad,
el 32% del consumo es residencial (Instituto de Estudios Urbanos, 2005).
La metodología está basada en el método Cross Industry standar Process for Data Mining (CRISP-
DM) (ver anexo 1). En primer lugar, se realiza la comprensión exhaustiva del negocio; en segundo
lugar, se lleva a cabo una comprensión de los datos. En tercer lugar, se realiza la limpieza y
preparación de los datos y, particularmente, una formulación de los indicadores que reflejan el
nivel de ahorro o derroche de cada cliente. Después, en la cuarta etapa, en la cual se realiza el
modelaje con modelos de árboles de decisión y clustering. Posteriormente, viene la etapa de
evaluación y análisis; seguida de la etapa de acción, en la cual se analizan los lineamientos de las
estrategias de direccionamiento de las campañas de concientización.
Para el desarrollo de la investigación, se recopiló una muestra significativa de datos de primera
mano que surgieron de la interacción entre los hogares consumidores de energía eléctrica y el
DANE -Departamento Administrativo Nacional de Estadística-.
Revisión de Literatura El campo de la modelación de consumo de energía ha sido abordado desde muchas perspectivas
en tanto la electricidad tiene una correlación muy fuerte con el desarrollo de una sociedad y hoy
en día es un servicio vital en el día a día de las personas. En esta medida, han surgido diversos
intereses en entender el consumo con el fin de explotar las oportunidades de negocio, de mejora
de políticas o de responsabilidad social. Por ejemplo, se han realizado estudios en los cuales se
modela el consumo agregado de energía, o se desarrollan modelos que predicen la demanda de
energía eléctrica que, a su vez, es caracterizada. En otros países se han desarrollado análisis
descriptivos del ahorro de energía residencial y, específicamente, en países como España,
Inglaterra y Estados unidos se han desarrollado modelaciones del consumo de energía con enfoque
a la caracterización del ahorro de este servicio. En Colombia, se ha modelado el consumo de
energía con el fin de caracterizar el ahorro, la demanda en sí misma, o los perfiles de clientes
hurtadores y no hurtadores, no se han realizado modelaciones enfocadas
Concretamente, Gonzalez, Pavas y Sánhez (2016) en su investigación “Quantification of electrical
energy savings in residential customers through demand management strategies”, motivados por
la escasez de energía en Colombia entre 2015 y 2016, presentan la cuantificación del ahorro de
energía en clientes residenciales de Bogotá a partir de modelos de Knapsack Problem. Gonzalez,
Pavas y Sánhez (2016) concluyen afirmando que los consumos bajos de energía podrían conseguir
un ahorro de hasta 45% mediante cambio de hábitos y de dispositivos eléctricos; mientras que los
consumos superiores a 150 kWh/mes no lograrían ahorros superiores al 20%.
Por otro lado, Valor, Climent y Caselles (2004) en su escrito “A model for the Spanish sectorial
electricity demand” desarrollaron modelos enfocados a analizar el consumo de energía por sector
– residencial e industrial- con respecto a variables meteorológicas. Para lo anterior, los autores
utilizaron regresiones cuyas variables explicativas eran la temperatura, el mes, estacione y demás
derivados del clima. Además, se incluyen variables sociodemográficas aplicables a la
caracterización de los perfiles de derrochadores a la que se quiere llegar. Al final de su escrito,
Valor, Climent y Caselles (2004) concluyen que el comportamiento de consumo residencial se ve
3
muy correlacionado con la temperatura y estacionalidades de esta, lo cual, soportan diciendo que
los modelos aplicados explican entre el 82 % y 92% de los cambios en el consumo de energía
residencial.
Pinzón (2010) en su investigación de maestría “Estimación de Funciones de Consumo de Energía
Eléctrica para Clientes Residenciales en Bogotá” “aplica una metodología para determinar
funciones de consumo de energía en el sector residencial” (Pinzón, 2010) mediante conceptos
teóricos como el lema de Sheppard. Si bien, esta investigación está inclinada hacia aspectos
investigativos de la academia económica, se emplean y analizan variables de hábitos de consumo
empíricos que son útiles para este escrito. Pinzón (2010) concluye explicando que el consumo de
energía residencial en un contexto como el bogotano, en el cual las tarifas del servicio están
diferenciadas por bloques de precios, está explicado por la estratificación socioeconómica. En este
mismo camino, pero de manera más amplia, Lukas G. Swan (2008) en su documento “Modeling
of end-use energy consumption in the residential sector: A review of modeling techniques”
identifica y revisa diferentes maneras en las que ha sido modelado el consumo de energía y las
analiza desde la perspectiva de “arriba hacia abajo” y de “abajo hacia arriba”. En la primera
perspectiva, “el sector residencial es un sumidero de energía y no se preocupa por los usos finales
individuales”. En la segunda, se toma como base una muestra representativa de hogares a la cual
le es estudiado el consumo con método estadísticos y de ingeniería. El aporte de Pinzón (2010) en
su documento es concientizar acerca de las ventajas y desventajas de los diferentes modelos
aplicados en variados contextos.
Aun en la línea de la modelación de consumo de energía, pero con un enfoque dirigido al análisis
del ahorro para sugerir políticas públicas que aumenten el consumo de energía eficientemente,
Almeida, Fonseca, Escholmann y Feilberg (2011) en el documento “Characterization of the
household electricity consumption in the EU, potential energy savings and specific policy
recommendations” realizan la identificación de tendencias de la demanda con respecto al
comportamiento, niveles de confort y tipos de electrodomésticos en el hogar. Con el fin de
aumentar la comprensión del consumo de energía, los autores recolectaron información robusta a
partir del seguimiento energético de 12 países de la UE y de encuestas que abordan el estilo de
vida. Almeida, Fonseca, escholmann y Feilberg (2011) concluyeron que la tecnología asociada al
entretenimiento tiende a aumentar el consumo de energía; sin embargo, existen tecnologías de
entretenimiento que, enfocadas al comportamiento responsable, pueden reducir drásticamente el
consumo innecesario. En palabras de los autores, “el potencial de ahorro de electricidad del sector
residencial europeo que puede ser implementado por las tecnologías existentes y el
comportamiento mejorado puede alcanzar el 48%” (, Almeida, Fonseca, Escholmann y Feilberg,
2011).
Para terminar esta revisión bibliográfica que trajo a colación investigaciones que aportan de
manera directa a la estructura de este proyecto, es pertinente abordar la tesis de Alvaro Acosta y
Elsa Moreno “Detección De Clientes Hurtadores De Energía En CODENSA S.A.” en tanto en ella
se utilizaron modelos similares a los planteados en este escrito. En su documento, Acosta y Moreno
(2011) modelaron el consumo de energía en Bogotá, enfocados en identificar los perfiles de los
clientes que son más propensos a hurtar o cometer fraude en el consumo de este servicio. Para lo
4
anterior, los autores emplearon modelos de clusters, segmentación y árboles de decisión con base
a la variable dummie que responde al comportamiento del cliente con respecto al hurto de energía
(1=Si es hurtador, 0=No es hurtador).
A diferencia de los anteriores estudios revisados, el objetivo de este estudio consiste en analizar
los perfiles de los consumidores que son más propensos a derrochar y ahorrar, para desarrollar
estrategias de responsabilidad social e incentivar el consumo eficiente de energía eléctrica. Sin
embargo, este escrito para su desarrollo rescata aspectos clave como metodologías a la hora de
definir los criterios de derroche o ahorro, y selección de variables y modelos.
Marco Teórico En términos generales, este proyecto emplea la metodología de CRISP-DM, pues, ésta es una
herramienta de minería de datos, utilizada en la Inteligencia de Negocios1, que facilita la extracción
de conocimiento y entendimiento de situaciones o comportamientos a partir de los datos que una
organización, en este caso el DANE, crea o recolecta en su operación. Concretamente, la
metodología CRISP-DM facilitará el desarrollo de esta investigación en tanto propone un proceso
organizado de entendimiento del contexto, recolección y organización de datos, modelaje y
conclusión. Además, los modelos de minería de datos que suelen emplearse junto con esta
metodología permiten la caracterización de los clientes derrochadores y ahorradores que se busca.
CRISP-DM CRISP-DM (Cross Industry Standart Process for Data Mining) es una metodología que se basa
en la jerarquización de procesos y tareas principales con el fin de entender y abordar, desde lo
general hasta lo específico. En este caso se busca, específicamente, entender las características de
perfiles de consumidores de energía derrochadores bajo diferentes contextos.
Esta metodología se compone de tareas correspondientes a 4 niveles de profundidad que son Fases,
Tareas Generales, Tareas Específicas e Instancias de Proceso.
En el nivel Fases, CRISP.DM está estructurada en seis fases, las cuales tienen implícitas tareas
generales -segundo nivel- (Ver anexo 1):
1 Inteligencia de negocios: Es el conjunto de técnicas y estrategias soportadas en el manejo de datos, que permiten la creación de conocimiento importante en la toma de decisiones.
Figura 1: Esquema de Extracción de los 4 niveles de profundidad de le metodología CRISP-DM
Tomado de: Rodriguez (2010). Metodologías para el desarrollo de proyectos de Data Mining
5
- Entendimiento del negocio/problema: En esta fase se quiere comprender cuál es el objetivo
del proyecto con respecto a un entorno y exigencias específicas
- Entendimiento de datos: Esta fase comprende las tareas de recolección de datos,
identificación de calidad de los datos, análisis descriptivo de los datos y formulación de
hipótesis.
- Preparación de datos: En esta fase se llevan a cabo tareas como la selección de variables,
filtrado de segmentos a analizar, limpieza de datos, y transformación y creación de
variables.
- Modelado: En esta fase se realizan las tareas de escogencia de la técnica o tipo de modelo
a aplicar. En este caso, se realizaron modelos de árboles de decisión y clustering ya que
estos están enfocados a la caracterización.
- Evaluación: En esta fase, la principal tarea es evaluar los modelos realizados en la fase
anterior con el fin de escoger el más viable para la investigación o mejorar los que ya se
habían escogido.
- Despliegue o Explotación: En esta fase, se utiliza el modelo con mejor desempeño para
llevar a cabo procesos de predicción de nuevos conjuntos de datos.
El nivel de Tareas Generales se compone de las tareas mencionadas en la descripción de las fases,
pero de una manera genérica. En contraste, las Tareas Específicas, son la razón de las tareas
generales. En otras palabras, las tareas específicas son las de enfocar las tareas generales para
conseguir un objetivo específico. Por ejemplo, si el problema abordado se pudiese solucionar con
modelos de clustering, la tarea específica es la de definir cómo debería llevarse a cabo una tarea
general como la limpieza de datos.
En el nivel de instancias de proceso, se realiza el diseño de estrategias de toma de decisión a partir
del conocimiento extraído de los resultados fruto de la ejecución del modelo.
Por otro lado, los Árboles de Decisión son una herramienta de minería de datos que es utilizada
para dividir un conjunto de datos en subgrupos y poder clasificar observaciones con respecto a una
variable objetivo que debe ser nominal. Cada división que realiza el árbol de clasificación debe
hacerse bajo un criterio de pureza de la subdivisión y, preferiblemente, también bajo un criterio de
significancia en el tamaño de la subdivisión/nodo. En este sentido, el “Gini Index” es un indicador
que une los criterios de pureza y tamaño para decidir cuál es la mejor división para realizar. La
siguiente es la fórmula del Gini Index
El Cutoff es la probabilidad o propensión mínima exigida para que el árbol de clasificación pueda
clasificar a una observación como evento
El Cluster es otra herramienta importante de minaría de datos en tanto no requiere de una variable
objetivo para clasificar y segmentar la muestra. Por lo anterior, éste es un modelo no supervisado
6
que “busca agrupar casos según sus similitudes para determinar segmentos homogéneos según sus
atributos” (Ruiz, 2018).
Carga típica La carga típica es aquella carga teórica que es calculada con el fin de cuantificar la capacidad de
carga de un circuito para su diseño. En el caso de las viviendas, la carga típica es calculada con
base a estudios que contabilizan la energía requerida para que un hogar promedio, según estrato y
condiciones geográficas, pueda satisfacer sus necesidades de cualquier tipo. Por lo anterior, la
carga típica es una variable indispensable en la clasificación de los clientes en tanto muestra cuál
es el consumo que, en teoría, es más eficiente.
Concretamente, la UPME (Unidad de Planeación Minero-Energética) deduce una carga típica para
un hogar promedio según el estrato, tipo de población (Rural y urbana) y altura sobre el nivel del
mar. La categorización de la carga típica para Bogotá se encuentra en el anexo 2.
Cálculo de consumo per cápita utilizando el valor del recibo de energía
eléctrica La creación de la variable de consumo per cápita que consiste en la división del consumo del
hogar sobre el número de personas que componen dicho hogar. Para ello fue necesario calcular el
consumo del hogar medido en KWh por mes, pues inicialmente solo se contaba con el valor del
recibo de energía eléctrica. De manera similar al cálculo del consumo per cápita, el consumo de
energía del hogar era el resultado de dividir el valor del recibo de energía sobre la tarifa por Watt
consumido. Sin embargo, en Bogotá las tarifas de energía eléctrica están diferenciadas por
estrato, pues, el estrato 5 y 6 subsidian un 60% y 50% de la energía consumida por los estratos 1
y 2, respectivamente, que consuman menos del consumo básico de subsistencia (130KWh/mes);
entonces, si el hogar de estrato 1 y 2 consume menos de 130Kwatts la tarifa con la que se calcula
su valor a pagar es de $190/kWh y $240/kWh, respectivamente. Si consume más de 130KWh la
tarifa es de $440/KWh (Ver anexo 3).
En esta medida, para calcular el consumo de los hogares de los estratos 1 y 2, se utilizó la
siguiente función condicional
𝒔𝒊 (𝑬𝒔𝒕𝒓𝒂𝒕𝒐 = 𝟐 , ∨, 𝑬𝒔𝒕𝒓𝒂𝒕𝒐 = 𝟏), ∧,
𝒗𝒂𝒍𝒐𝒓 𝒅𝒆 𝒓𝒆𝒄𝒊𝒃𝒐 > 𝟏𝟑𝟎𝒌𝑾𝒉 ∗ $𝟒𝟒𝟎 ⟹ 𝒄𝒐𝒏𝒔𝒖𝒎𝒐 =𝒗𝒂𝒍𝒐𝒓 𝒅𝒆 𝒓𝒆𝒄𝒊𝒃𝒐
$𝟒𝟒𝟎
𝒔𝒊 𝑬𝒔𝒕𝒓𝒂𝒕𝒐 = 𝟐 ,∧, 𝒗𝒂𝒍𝒐𝒓 𝒅𝒆 𝒓𝒆𝒄𝒊𝒃𝒐 ≤ 𝟏𝟑𝟎𝒌𝑾𝒉 ∗ $𝟐𝟒𝟎 ⟹ 𝒄𝒐𝒏𝒔𝒖𝒎𝒐
=𝒗𝒂𝒍𝒐𝒓 𝒅𝒆 𝒓𝒆𝒄𝒊𝒃𝒐
$𝟐𝟒𝟎
𝒔𝒊 𝑬𝒔𝒕𝒓𝒂𝒕𝒐 = 𝟏 ,∧, 𝒗𝒂𝒍𝒐𝒓 𝒅𝒆 𝒓𝒆𝒄𝒊𝒃𝒐 ≤ 𝟏𝟑𝟏𝒌𝑾𝒉 ∗ $𝟏𝟗𝟎 ⟹ 𝒄𝒐𝒏𝒔𝒖𝒎𝒐
=𝒗𝒂𝒍𝒐𝒓 𝒅𝒆 𝒓𝒆𝒄𝒊𝒃𝒐
$𝟏𝟗𝟎
7
Definición de Criterios de Caracterización Para poder caracterizar a aquellos clientes que son ahorradores o derrochadores es necesario, en
primer lugar, definir los criterios de caracterización. Es decir, saber cómo identificar si algún
cliente es derrochador/ahorrador o no, es necesario para poder describirlo. Concretamente, lo que
se quiere es definir el tipo de consumidor (ahorrador o derrochador) a partir del comportamiento
del consumo de energía eléctrica. En esta medida, a pesar de que dicho consumo depende de varias
variables explicativas, en este punto el objetivo específico es establecer un criterio en forma de
variable binaria que defina el rol del cliente frente al comportamiento de derroche (1=es
derrochador, 0=no es derrochador). De la misma manera ocurre con la variable binaria que
describe si el cliente es o no ahorrador (1=es ahorrador, 0=no es ahorrador). Estas variables serán
1 o positivas si el consumo del hogar supera un umbral en el exceso de consumo, con respecto a
la “Carga Típica Básica” de consumo eléctrico. Por el contrario, si el umbral no se supera las
variables tendrán un valor de 0 o negativo.
Con respecto a lo anterior, es importante aclarar que en la práctica el consumo bruto de un hogar,
por más alto que sea, no necesariamente implica que ese hogar esté derrochando la energía en tanto
hay variables como la tecnología de los electrodomésticos utilizados y la cantidad de personas que
habitan en la vivienda, que influyen en el aumento de consumo necesario por vivienda.
En primer lugar, si bien los electrodomésticos más antiguos tienen a consumir más energía que
electrodomésticos más modernos al prestar el mismo servicio, los habitantes de la vivienda
necesitan utilizarlos para sus actividades diarias sin importar si éstos son nuevos o no. De hecho,
en muchos casos las condiciones socioeconómicas de los hogares impiden el acceso a tecnologías
más modernas ya que éstas tienden a ser más costosas. Con el fin de eliminar el sesgo explicado
anteriormente, se segmentó la muestra de clientes por condiciones socioeconómicas. En otras
palabras, la muestra se dividió con respecto a los estratos socioeconómicos determinados por el
DANE, pues, de esta manera se puede individualizar el criterio de clasificación y evitar un sesgo
de generalización del contexto.
Además, esta estrategia de segmentación de la muestra por estratos también permite incluir en la
investigación la variable explicativa de tarifa por estrato. En Bogotá, el distrito estableció un
impuesto en la tarifa de energía a los estratos 5 y 6 con el finde que éstos subsidien una parte de la
tarifa de los estratos 2 y 3.
En segundo lugar, el número de personas por vivienda impide una comparación objetiva de los
diferentes consumos pues, es de esperarse que entre más habitantes haya en una vivienda, el
consumo sea mayor sin que esto signifique consumo ineficiente. Para corregir este sesgo, el criterio
de clasificación no se realizará con respecto al consumo bruto de cada hogar sino con respecto al
consumo per cápita de cada vivienda. La ecuación de la anterior condición es la siguiente:
𝑪
𝑵= 𝓬
8
Donde C es el consumo bruto del hogar, N es el número habitantes por vivienda y c es el consumo
de energía per cápita de esa vivienda.
Criterios de Perfiles
Para avanzar con el proceso de determinación de criterios, se imponen los siguientes supuestos:
1. Entre más consumo de energía, más costosa es la factura
2. Los consumidores tienden a optimizar sus recursos. Es decir, tienden a minimizar sus
costos mientras maximizan su bienestar. Dicho en otras palabras, frente al trade off de gasto
en la factura y aumento de bienestar, el consumidor busca un punto de equilibrio. En teoría,
dicho equilibrio se consigue con la “Carga Típica Básica o de Subsistencia”
3. Según los anteriores dos supuestos, es de esperar que las personas que estén bajo un mismo
contexto/estrato, tiendan a consumir cantidades de Kilovatios/hora similares.
En esta medida, dependiendo de las características de consumo de los grupos y una regla de
cuantificación del sobreconsumo o ahorro, se establecerá un criterio específico que clasifique a los
hogares. En términos generales, la distribución de las frecuencias de los diferentes consumos dará
los insumos necesarios para la construcción de la regla que muestra el criterio de clasificación.
Específicamente, si el consumo es excesivo, se genera un sobre consumo que, al ser muy grande,
se convierte en derroche. En este sentido, un sobre consumo es grande y se convierte en derroche
cuando es mayor que la diferencia entre el consumo en el percentil 75 y el consumo en el percentil
25 (ver figura 2). La lógica de lo anterior está basada en los supuestos y se explica en las cuatro
siguientes partes:
1. El sobre consumo es lo que se consume de más, con respecto a la carga de consumo típica
2. La resta entre los consumos del percentil 25 y del percentil 75 es un intervalo que cuantifica
el nivel de sensibilidad del criterio a la hora de clasificar. Si dicho intervalo es más
pequeño, los sobreconsumos tienen más probabilidad de ser derroche; por ende, dicha
sensibilidad también puede verse como la tolerancia que el modelo y el comportamiento
generalizado en un contexto/estrato le dan al sobreconsumo.
3. si el sobreconsumo supera la tolerancia, será catalogado como derroche
9
Marco empírico: Desarrollo de CRISP.DM
Comprensión del Problema Funcionarios de Codensa -Empresa comercializadora de energía eléctrica en Colombia-, desde una
perspectiva empírica, intuyen que en Bogotá hay muchos hogares que, estando en diferente
contexto, incurren en el derroche de energía eléctrica. Por ende, tal derroche proveniente de los
bogotanos genera distorsiones en la planeación de generación de energía, lo cual va en contra de
los parámetros de sostenibilidad ambiental y los objetivos de desarrollo sostenible en tanto se
utilizan ineficientemente recursos naturales no renovables o contaminantes.
Con el fin de disminuir el derroche de energía es necesario realizar algunas acciones correctivas
con los hogares que, efectivamente, son derrochadores o acciones preventivas con aquellos que
tengan alta propensión a derrochar.
Por lo anterior, se requiere determinar, bajo los criterios expuestos en el numeral 3.3 “Criterios de
Caracterización”, qué hogares son derrochadores y con el análisis de esta muestra de la población
bogotana determinar la propensión de derroche de otros hogares que no pertenezcan a la muestra
inicial. Una vez categorizados todos los hogares de toda la muestra a trabajar entre derrochadores
y no derrochadores, es importante determinar las características de los diferentes perfiles de
derrochadores con el fin de direccionar y establecer mensajes o políticas de concientización más
eficientes cuando se quiere disminuir el derroche de energía eléctrica.
10
Comprensión de datos y Preparación de datos La creación de la base de datos a tratar utilizó como principal insumo la Encuesta Multipropósito
de 2017, de la cual se recogió información de los capítulos A, B, C, D, H, K, M1, M2 que abordan
diferentes aspectos de la vida de los hogares (Ver tabla 1). Después de fusionar los capítulos de la
encuesta, por medio de la variable DIRECTORIO -identificador de cada observación-(Ver anexo
4), la muestra se filtró para escoger solamente aquellos hogares de Bogotá que consumen energía
eléctrica.
El siguiente paso fue calcular el consumo de energía per cápita de cada hogar y así construir la
variable binaria que indica si el hogar derrocha o no. Sin embargo, dentro de la muestra había
casos en los que no existía el dato del último pago del recibo de energía que, como se vio en el
numeral 3.2 “Calculo del Consumo Per Cápita Utilizando el Valor del Recibo de Energía”, es el
insumo fundamental en la construcción del indicador de derroche. Por ende, se realizó una
partición de la muestra. Por un lado, se generó otra base de datos utilizada para los procesos de
train y validate del modelo, que estaba compuesta por los datos de 64868 hogares a los cuales sí
les pudo ser calculado un consumo y, además, habían respondido la encuesta en meses diferentes
a enero2. Por otro lado, se generó otra base de datos, compuesta por información de 9092 hogares,
que se utilizó en el proceso de scoring del modelo ya que se componía de los datos de hogares a
los cuales no les pudo ser calculado el consumo. La composición de la base de datos quedó de la
siguiente manera en que se muestra en el anexo 5.
Por otro lado, como se ve se ve en la siguiente gráfica, la distribución en percentiles del consumo
per cápita por hogar se comporta de la siguiente manera: En los estratos 1 y 2, el consumo
promedio per cápita es cercano a los 55 kWh y los diferentes consumos son muy parecidos entre
sí, pues, entre el percentil 25 y el 75 hay aproximadamente 35 kWh. En cuanto a los estratos 3 y
4, el consumo promedio per cápita es cercano a los 75 kWh y se presenta una mayor disparidad
entre los consumos, con respecto a los estratos 1 y 2, en tanto la diferencia de consumos entre el
percentil 25 y el 75 es aproximadamente de 45 y 50 kWh en los estratos 3 y 4 respectivamente.
Con respecto al estrato 5, el consumo promedio per cápita es de 96 kWh y se presenta una
disparidad aun mayor entre los consumos, con respecto a los anteriores estratos, en tanto la
diferencia de consumos entre el percentil 25 y el 75 es de 64kWh. En cuanto al estrato 6, el
consumo promedio per cápita es de 150 kWh y se presenta una disparidad significativamente
mayor entre los consumos, con respecto a los anteriores estratos, pues, la diferencia de consumos
entre el percentil 25 y el 75 es de 104kWh. Entonces, se puede evidenciar que entre mayor es el
estrato, mayor es el consumo promedio y mayor es la disparidad entre los consumos per cápita
dentro del mismo estrato.
2 En la partición dedicada a Train y Validate, no se tuvo en cuenta para esta partición a aquellos que respondieron la encuesta en el mes de enero pues la variable primordial para el cálculo de consumo de energía es aquella que responde a la pregunta “¿Cuánto pagó la última vez por el recibo de Energía?”; entonces, aquellos entrevistados en enero reportaran el pago de Diciembre, un mes con una marcada estacionalidad en cuanto al consumo de energía por las luces navideñas y la época de vacaciones.
11
Figura 3: Distribución en percentiles del consumo per cápita versus estrato
Fuente: Elaboración propia
Además, en la etapa de preparación y entendimiento de datos es pertinente describir cómo se
comportan los derrochadores frente a diferentes variables. Profundizando en este punto, es
pertinente decir que, debido a la existencia de disparidad entre las categorías de las variables
nominales, no tiene sentido analizarlas con respecto a la categorización de derroche – todos los
barrios, localidades, niveles de estudio y demás tienen frecuencias muy diferentes- Sin embargo,
sí tiene sentido y llama la atención que, como se ve en la gráfica, quienes derrochan tienden a tener
menos dispares entre sí, y menores con respecto a quienes no derrochan.
Figura 4: Distribución en percentiles de ingresos versus derroche
Fuente: Elaboración propia
Modelaje y Evaluación Después de haber construido la base de datos para Train y Validate, el primer paso es poder
puntuar y definir la propensión a derrochar de aquellos hogares de los cuales se tiene la
información de consumo de energía y, a partir de ellos, definir la propensión y comportamiento de
12
derroche de los hogares de los cuales no se conoce su consumo de energía y hacen parte de la base
de datos de Score. Para lo anterior, se requiere de un modelo que sea capaz de capturar el
comportamiento de derroche de los hogares sin sobre ajustarse a la información de consumo, pues,
en la base de datos de Score no se tiene información de consumo. Específicamente, se crearon
cuatro modelos de árboles de clasificación con criterio de Gini para la decisión de los splits/
subdivisiones (ver anexo 10). El árbol 1 es un modelo que se compone de las variables que fueron
insumo para la construcción de la variable binaria “derrocha”. Concretamente, en es modelo se
utilizaron las variables input de consumo per cápita, estrato, pago del servicio, número de personas
por hogar. El árbol 2 funciona con las variables input que tienen más Worth a excepción de las
utilizadas en el modelo 1. El modelo 3 funciona con todas las variables de la base de datos y omite
las utilizadas en el modelo 1 menos el pago del servicio eléctrico. Y el modelo “nph” funciona
igual que el modelo 3 pero en vez de utilizar la variable de pago del servicio eléctrico, utiliza el
número de personas por hogar.
Como era de esperarse, el modelo 1 y 3 tuvieron mejor desempeño en cuanto al ROC, pues como
se ve en la figura 5, tuvieron mejor sensitividad (precisión de predecir eventos) y mejor
especificidad (precisión de predecir no eventos). Además, la rata de error de clasificación menor
la genera el modelo 1 y en segundo lugar el modelo 3. Sin embargo, a pesar de tener buen
desempeño trabajando con las particiones de Train y Validate, se intuye que el modelo 1 y 3 están
sobre ajustados cuando trabajan con otra base de datos utilizada para Score debido a que estas
últimas pueden no contener las variables principales que fundamentan el modelo. Por ejemplo, el
modelo 1 y 3 tienen como variables principales el consumo per cápita por hogar, pero la base de
datos de Score no contiene dicha información. Por lo anterior, el modelo más acorde a las
necesidades es el “nph” en tanto todas sus variables principales también hacen parte de la base de
datos de Score. Concretamente, la variable de número de personas por hogar es un insumo
importante para la construcción del indicador de derroche y, además, es fundamental en la
construcción del modelo “nph” a la vez que es una variable que se encuentra presente en la base
de datos de Score. Dado que este modelo “nph” solamente contenía una variable importante en la
creación del indicador de derroches, se definió con más profundidad y mayor límite de divisiones
por variable y menor cantidad mínima de observaciones por nodo con el fin de aumentar su
capacidad de modelar el consumo de energía. Específicamente, en el modelo “nph” se definió una
profundidad máxima de 15 “generaciones” del árbol, máximo 5 subdivisiones por variable y
mínimo 50 observaciones por nodo; mientras que en el resto de los modelos se definió una
profundidad máxima de 10 “generaciones” del árbol, máximo 3 subdivisiones por variable y
mínimo 250 observaciones por nodo.
13
Figura 5: Evaluación de Modelos de Árboles de Decisión
Fuente: Elaboración propia
Además, el modelo “nph” aparte de ser el más acorde a las necesidades del análisis, también tiene
un buen desempeño con respecto al porcentaje acumulado de respuesta capturada y al lift
acumulado. Más precisamente, cuando se habla del lift acumulado del modelo “nph”, puede
decirse que tomando en cuenta el 20% de los hogares ordenados por la probabilidad estimada de
derroche se identifican clientes que son 3.3 veces más propensos a derrochar, que si se toman al
azar (ver anexo 6). Cuando se habla del porcentaje acumulado de respuesta capturada del modelo,
se observa que tomando en cuenta el 20% de los hogares ordenados por la probabilidad estimada
de derroche se identifican el 66% de los hogares que derrochan (Ver anexo 7).
Habiendo seleccionado el modelo más pertinente, se procede a puntuar a aquellos hogares
pertenecientes a la base de datos de score que no han sido clasificados. Una vez sometida la base
de datos de score al modelo, se requiere un criterio que permita decidir cuáles hogares, dada su
propensión a derrochar, serán categorizados como derrochadores. En otras palabras, se requiere
definir el indicador cutoff que es el umbral de propensión desde el cuál se categorizan los hogares
como derrochadores o no derrochadores. Se estableció que dicho indicador cutoff sería del 50%
en tanto todos aquellos hogares categorizados como derrochadores dentro de la base de datos de
training obtuvieron una propensión mínima del 50%.
Una vez fueron categorizadas las observaciones de la base de datos de score, el siguiente paso fue
la creación de una nueva base de datos conformada únicamente por los hogares categorizados
como derrochadores, pues, eran estos a quienes se quería identificar. De esta manera, se procedió
a utilizar el modelo de Clusters con el fin de determinar los perfiles más significativos dentro de
la muestra de derrochadores. En otras palabras, en esta etapa se procede a categorizar y realizar un
perfilamiento de los consumidores de energía que derrochan.
Teniendo en cuenta que uno de los principales objetivos de los principales objetivos de este
proyecto es proponer algunos lineamientos generales para la elaboración de políticas públicas o
proyectos de concientización y aumento del consumo eficiente de energía, es pertinente determinar
e identificar diferentes perfiles globales, y no con gran nivel de especificidad, a los cuales pueda
llegarse generalizadamente con los proyectos antes mencionados. Por la razón anterior, se
configuró un modelo de clustering cuyo resultado fuera un conjunto de tamaño reducido, con el
14
fin de identificar perfiles globales y no demasiado específicos. Concretamente, el número máximo
de clusters creados por el modelo es menor o igual a 6.
Como puede verse en el anexo 8, del modelo resultaron tes principales segmentos. El cluster más
grande fue el número 5 con un tamaño de 37% con respecto al tamaño total de la muestra analizada
-Tarin, Validate y Score-. El segundo cluster más representativo con un tamaño del 30% del total
de la muestra fue el número 6 y el tercer; y el tercer cluster con un tamaño de 23% fue el número
4. Además, en la figura 6, puede observarse que el modelo que debía identificar perfiles globales
tuvo un buen desempeño en tanto logró identificar tres perfiles significativos en tamaño y en
diversidad de localidad y de barrios a pesar de tener que cada segmento tiene una composición
diferente en cuanto a la variable de estrato. Entonces, los clusters identificados cubren gran parte
del territorio de Bogotá y, a su vez, capturan las diferentes composiciones de estratos en cada zona.
Dicha globalidad puede traducirse en un largo alcance de las políticas o campañas que se
desarrollen con base a los perfiles basados.
Figura 5: Gráfico de segmentos por variable
Fuente: Elaboración propia
**Nota: cada color representa una categoría dentro de la variable nominal graficada.
Acción Por último, se procede a proponer los lineamientos generales para políticas públicas o proyectos
de aumento de consumo eficiente de energía con base a los tres principales perfiles identificados
en el punto anterior. Teniendo en cuenta lo anterior, el primer lineamiento a proponerse gira en
torno a la compatibilidad del proyecto de concientización con los perfiles identificados.
Concretamente, dichos proyectos deben estar orientados y dirigidos a tener a establecer una
relación estrecha entre la necesidad de consumo responsable y cada una de las variables
identificadas dentro de cada perfil. A partir de esta relación, se debería diseñar el mensaje y
objetivo principal del proyecto de concientización.
Con el fin de realizar las propuestas de los lineamientos generales, es necesario describir cada
segmento identificado. En primer lugar, el segmento 5 se compone de hogares que pagan tarifas
intermedias de internet y televisión- alrededor de 37 mil pesos y 27 mil pesos, respectivamente-,
pertenecen a estrato 2 y 3, tienen más de tres integrantes en su vivienda y pagan máximo 20 mil
pesos de administración. En este caso, es pertinente resaltar que estos hogares son de estratos
medios bajos y a pesar de ser derrochadores no suelen pagar suscripciones costosas de internet y
televisión. Por lo anterior, sería interesante pensar en alianzas entre el distrito, proveedores de
15
energía y proveedores de internet y cable para compensar el ahorro o uso per cápita eficiente de
energía mediante beneficios en estos servicios que incentiven a los hogares a mejorar sus hábitos
de consumo de energía.
El segmento 6 se compone de hogares pertenecientes al estrato 3 y 4, con mínimo un laptop,
microondas y horno en su vivienda, que pagan mínimo 100 mil pesos de administración, que pagan
mínimo 37 mil pesos de internet y 34 mil pesos de cable, y con pregrado como titulo más alto de
educación. En este caso, hay que resaltar que los hogares que integran este cluster son de clase
media, educados, con más dispositivos y electrodomésticos, y que están dispuestos y en capacidad
de pagar por más contenido digital transmitido a través de internet y de cable. Por lo anterior,
podría abordarse el problema de consumo ineficiente de energía de la misma manera propuesta en
el párrafo anterior -alianzas entre proveedores de servicios y el distrito, que permitan beneficios a
cambio de aumentar la eficiencia en el consumo-, pero, esta vez, apelando al uso continuo y
desmedido de los electrodomésticos. Es importante resaltar que, a diferencia del anterior cluster,
este debe ser expuesto a mensajes con contenido más elaborado en tanto los integrantes de este
cluster suelen tener estudios universitarios terminados.
El segmento 4 se compone de hogares pertenecientes al estrato 2, con ingresos menores a
2,500,000 pesos, sin internet, sin computadores, pago de cable inferior a 7 mil pesos, y un nivel de
educación media (de 10mo a 13vo) como nivel de educación máximo. Entonces, este perfil se
compone de hogares de estratos bajos con un nivel bajo de educación, sin internet ni gran cantidad
de electrodomésticos. Por lo anterior, la forma de abordar el consumo ineficiente de este perfil se
debería hacer apelando a recargos en el precio del kWh o disminución del subsidio de energía a
medida que aumente el derroche.
Otro aspecto importante de los lineamientos propuestos, son los canales de comunicación y
contacto con el derrochador, pues, estos permiten que el mensaje pueda ser recibido por el
derrochador. Con respecto a los segmentos 5 y 6, es útil utilizar medios audiovisuales transmitidos
por internet y por televisión en tanto dichos segmentos tienen acceso a este tipo de servicios y
medios de visualización del mensaje. También, como se dijo antes, es importante generar un
mensaje de contenido elaborado para el segmento con más nivel educativo. Por el contrario, el
canal más útil para llegar a los hogares del segmento 4 son la radio en tanto es un medio muy
utilizado en cualquier estrato y, sobre todo en los bajos. También, puede ser útil emplear
mecanismos de voz a voz por intermedio de las comunidades y representantes de los barrios para
que se informe de las consecuencias ambientales y monetarias que le acarreará un consumo
ineficiente.
Conclusión
El 22% de la muestra fue considerado como derrochador. El derroche que genera ese 22% equivale
al 35% del total de energía consumida por los integrantes de la muestra; sin embargo, estos datos
no se pueden extrapolar al total de la población bogotana en tanto la muestra es pequeña en
comparación con el número de habitantes de Bogotá. Específicamente, el tamaño de la muestra
era de 64868, que es tan solo el 0,8% de la población de Bogotá en el 2017 (8 millones de personas
16
aprox). Por tal razón la replicabilidad de la metodología desarrollada en esta investigación puede
verse afectada por la ausencia de datos suficientes.
A pesar de lo anterior, este proyecto desarrolla una metodología útil al momento de analizar el
comportamiento de derroche con respecto a otros servicios y/o recursos como el agua, pues, se
fundamenta en la modelización de comportamientos de derroche de servicios residenciales sin
importar cual fuese el servicio en cuestión
Un hallazgo importante dentro de la muestra analizada es que entre más alto el estrato, más
consumo per cápita de energía y más disparidad entre los consumos per cápita dentro de ese estrato.
A pesar del mayor consumo per cápita bruto en los estratos altos, menor es el porcentaje de
derroche en los mismos.
Finalmente, los perfiles identificados dividen la muestra en 3 clases socioeconómicas: Baja, media
baja y media. En los perfiles clase media, puede intuirse que el derroche ocurre mediante uso
desmedido de electrodomésticos. Por el contrario, se puede intuir que los perfiles de clase baja y
clase media baja incurren en la generación de derroche debido al subsidio y los bajos niveles de
educación pues, a pesar de tener menos electrodomésticos y dispositivos eléctricos, componen los
clusters/segmentos de derrochadores con frecuencias y tamaños más grandes. Dados las anteriores
conclusiones, queda por explorar y confirmar o refutar las hipótesis que surgieron de este estudio.
Referencias
- Gonzalez Orlando, Pava Andres, Sanchez Samir, “Cuantificación de Ahorro de Energía
Eléctrica en Clientes Residenciales Mediante Acciones de Gestión de Demanda”,
Universidad Industrial de Santander, Bucaramanga, Colombia. Tomado de:
http://revistas.uis.edu.co/index.php/revistauisingenierias/article/view/5747/7074
- Valor Enric, Climent Francisco, Meneu Vicente, Caselles Vicente, “A Model for the
Spanish, Sectorial Electricity Demand”, Departament d´Economia Financiera I
Matemàtica, Facultat d´Economia, Universitat de València. Tomado de:
https://www.uv.es/fcliment/REF_climent.PDF
- Pinzón Ivan, “Estimación de Funciones de Consumo de Energía Eléctrica para Clientes
Residenciales en Bogotá”, Pontificia Universidad Javeriana, Facultad de Ciencias
Económicas y Administrativas, Bogotá, 2010. Tomado de:
https://repository.javeriana.edu.co/bitstream/handle/10554/12105/PinzonVelaIvanRodrig
o2010.pdf?sequence=1
17
- Swan, L., & Ugursal, V. (2009). Modeling of end-use energy consumption in the residential
sector: A review of modeling techniques. Renewable and Sustainable Energy
Reviews, 13(8), 1819-1835. doi:10.1016/j.rser.2008.09.033
- Almeida, A., Fonseca, P., Schlomann, B., & Feilberg, N. (2011). Characterization of the
household electricity consumption in the EU, potential energy savings and specific policy
recommendations. Energy & Buildings, 43(8), 1884-1894.
doi:10.1016/j.enbuild.2011.03.027
- Acosta Alvaro, Moreno Elsa, “Detección de Clientes Hurtadores de Eneregía en Codensa
S.A.”, Facultad de Administración, Universidad de los Andes, Colombia.
- Shmueli G., Patel N., Bruce P., “Data Mining for Marketing Analytics
- SAS, "Applying data Mining Techniques Using SAS Enterprise Miner”, SAS Institute,
2005.
- SAS, "Predictive Modeling Using SAS Enterprise Miner”, SAS Institute, 2005.
- Tsiptsis K., Chorianopoulos A., “Data Mining Techniques in CRM – Inside Customer
Segmentation,” Wiley
18
Anexos.
Anexo 1.
Gráfica de metodología CRISP-DM
Anexo 2.
19
20
Categorización del consumo típico
Anexo 3.
Tomado de página web de Codensa.
21
Anexo 4.
Proceso de manejo y limpieza de datos
Anexo 5.
22
Variables y metadata
Anexo 6.
Num var CATEGORÍA GRUPO NOMBRE ESPECIFICACIÓN TIPO
1 DIRECTORIO identificador único del hogar intervalo
2 DPTOMPIO código del departamento Uniaria
3 COD_UPZ código del barrio nominal
4 CODLOCALIDAD código de la localidad nominal
5 tipoVivienda tipo de vivienda nominal
6 EE consume energía eléctrica binaria
7 Estrato estrato de la vivienda nominal
8 CercaCE está cerca de centros de distribución de energía binaria
9 Inseguridad ¿Es insegura la zona en la que vive? binaria
10 propVivienda ¿Es propiertario de la vivienda? nominal
11 ValorAmin valor de administración de la vivienda intervalo
12 NumpersHog npumero de personas en el hogar intervalo
13 NumCuartos npumero de cuartos intervalo
14 NumCuartVentana npumero de cuartos con ventana intervalo
15 EnergCocina ¿Cuál es la fuete de energía para cocinar? nominal
16 ApagLuz Apagar luces binaria
17 Planchar Plancha en una tanda o no plancha binaria
18 CambElectrodom cambiar electrodomesticos por otros de bajo consumo binaria
19 DescAparatos desconectar aparatos binaria
20 ReutAgua reutilizar agua binaria
21 RecLluvia recolectar lluvia binaria
22 SanitBajConsu sanitario de bajo consumo binaria
23 EconomAgua economizador de agua binaria
24 Lavadora tiene lavadora binaria
25 Nevera tienen nevera binaria
26 Estufa tiene estufa binaria
27 Horno tiene horno binaria
28 Microondas tiene microondas binaria
29 calentDuchEle tiene calentador para la ducha binaria
30 EquipSonid tiene equipo de sonido binaria
33 PagaElect paga el serevicio de energía eléctrica nominal
34 PagOtroElec paga el servicio con otros hogares binaria
35 NuHoPagEl ¿cuantos hogares pagan el servicio? intervalo
36 PagoElec ¿cuánto pagó de energía la última vez? intervalo
37 ConsElec ¿cuál es el consumo de energía? intervalo
38 MesesPagEle ¿cuántos meses pagó con el último recibo? intervalo
39 VerifPagElec verifíca lo que debe pagar en el recibo binaria
41 CortesElec ha presentado cortes del servicio binaria
42 CorteNoPag cortes por no pago binaria
43 CorteFalla cortes por fallas binaria
44 CorteOtro cortes por otra razón binaria
45 CorteNosabe binaria
46 NumPC número de pc que hay en el hogar intervalo
47 NumLaptop número de laptop que hay en el hogar intervalo
48 NumTablet número de tablet que hay en el hogar intervalo
49 Internet tiene internet binaria
50 PagoInternet ¿cuál fue el último pago de internet? intervalo
51 MesesPagIntern ¿a cuántos meses correspondió el pagó de internet? intervalo
52 PagoTv ¿cuánto pgó por tv la última vez? intervalo
53 MesePagoTv ¿a cuántos meses correspondió el pagó de tv? intervalo
54 ServDome paga por servicio doméstico binaria
55 GsatServDom ¿cuánto paga por el servicio doméstico? intervalo
56 educación CAP H Educacion nivel más alto de educación en el hogar nominal
57 ElctrodNuev ha adquirido electrodomésticos nuevos en los últimos 3 meses binaria
58 ContadoNuevElect ¿cuánto pagó de contado por loe ectrodomésticos nuevos? intervalo
59 CreditNuevElect ¿cuánto pagó de credito por loe ectrodomésticos nuevos? intervalo
70 Fuerza Laboral Cap K TotIngresosHog total de ingresos del hogar intervalo
71 Categorización --- derrochador ¿se considera derrochador? binaria
otros gastos CAP M2
CAP D
gastos hogares CAP M1
CAP BDatos vivienda y entorno
CAP Ccondiciones habitacionales del hogar
servicios publicos
Identificación CAP A
23
Lift
Anexo 7.
C%CR
Anexo 8.
División de Clusters
Anexo 9.
24
25
Anexo 10.
Proceso de modelaje en SAS EM