76
DISEÑO Y APLICACIÓN DE UNA METODOLOGÍA DE ANÁLISIS DE LAS DECISIONES PARA CARACTERIZAR LOS FACTORES DE SUPERVIVENCIA EMPRESARIAL EN PEQUEÑAS EMPRESAS DEL SECTOR MANUFACTURA DE LA CIUDAD DE BOGOTÁ D.C. DAVID ALFREDO ROMERO ACOSTA Tesis de Maestría Asesor: MARIO CASTILLO HERNÁNDEZ Profesor Titular Departamento de Ingeniería Industrial UNIVERSIDAD DE LOS ANDES FACULTAD DE INGENIERÍA DEPARTAMENTO DE INGENIERÍA INDUSTRAL BOGOTÁ D.C. 2019

DISEÑO Y APLICACIÓN DE UNA METODOLOGÍA DE ANÁLISIS DE …

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

DISEÑO Y APLICACIÓN DE UNA METODOLOGÍA DE ANÁLISIS DE LAS DECISIONES PARA CARACTERIZAR LOS FACTORES DE SUPERVIVENCIA EMPRESARIAL EN PEQUEÑAS

EMPRESAS DEL SECTOR MANUFACTURA DE LA CIUDAD DE BOGOTÁ D.C.

DAVID ALFREDO ROMERO ACOSTA

Tesis de Maestría

Asesor: MARIO CASTILLO HERNÁNDEZ

Profesor Titular Departamento de Ingeniería Industrial

UNIVERSIDAD DE LOS ANDES FACULTAD DE INGENIERÍA

DEPARTAMENTO DE INGENIERÍA INDUSTRAL BOGOTÁ D.C.

2019

TABLA DE CONTENIDO

0. Introducción 1. Descripción general del problema y el trabajo de tesis

1.1. Contexto del problema 1.2. Pregunta de investigación 1.3. Justificación

2. Objetivos 2.1. General 2.2. Específicos

3. Marco conceptual 3.1. Definiendo el fracaso empresarial 3.2. Clasificación de empresas en Colombia 3.3. Enfoque conceptual

3.3.1. Métodos de clasificación 3.3.2. Interpretabilidad vs poder predictivo 3.3.3. Medidas de desempeño

4. Revisión de literatura 5. Metodología general

5.1. Descripción de la metodología general 6. Diagnóstico general del problema

6.1. Situación general de las PYMES en Colombia 6.2. Pymes y el fracaso empresarial en Bogotá 6.3. Fracaso empresarial en el sector manufactura 6.4. Síntesis

7. Estructuración formal del problema 8. Diseño de la metodología específica para la clasificación de empresas PYME con fracaso

empresarial 9. Aplicación de la metodología específica 10. Conclusiones y recomendaciones Referencias bibliográficas Anexos

TABLA DE FIGURAS

Figura 1. Distribución según categoría empresarial sector manufactura año 2018 5 Figura 2. Cierre empresarial a Septiembre/2018 6 Figura 3. Comparación entre regresión lineal y análisis discriminante 12 Figura 4. Ejemplo de fraccionamiento de espacio mediante árboles de clasificación 13 Figura 5. Ejemplo de modelos caja negra 14 Figura 6. Comparación de propiedades explicativas y predictivas en modelos de clasificación 15 Figura 7. Ejemplo de una matriz de confusión 16 Figura 8. Ejemplo de Curva ROC 17 Figura 9. Desviación en organizaciones que conduce a crisis 19 Figura 10. Determinantes de la supervivencia empresarial 21 Figura 11. Metodología de solución de problemas con enfoque de Análisis de Decisiones 26 Figura 12. Razones para la discontinuidad empresarial en Colombia 28 Figura 13. Mapa de Bogotá por localidades y demografía empresarial 30 Figura 14. Fracaso empresarial por edades de empresas 31 Figura 15. Ingreso al mercado de nuevas empresas según sector económico 31 Figura 16. Metodología Específica para la clasificación de fracaso empresarial en PYMES 36 Figura 17. Fragmento de información recopilada para la construcción de la Base de Datos 40 Figura 18. Fragmento de la Base de Datos Construida 42 Figura 19. Diagrama de barras de cantidades de empresas según categoría 43 Figura 20. Diagramas de caja para razones de flujo de efectivo 44 Figura 21. Histogramas de razones de flujo de efectivo 45 Figura 22. Diagramas de caja para razones de rentabilidad 46 Figura 23. Histogramas de razones de rentabilidad 46 Figura 24. Diagrama de cajas para razones de endeudamiento 47 Figura 25. Histograma para razones de endeudamiento 47 Figura 26. Diagrama de cajas razones de liquidez 48 Figura 27. Histograma razones de liquidez 49 Figura 28. Diagrama de cajas razones de rotación 50 Figura 29. Histogramas razones de rotación 50 Figura 30. Diagrama de cajas razones del Altman Z-Score 51 Figura 31. Histogramas de razones Altman Z-Score 52 Figura 32. Diagrama de barras variable categórica Localidad 53 Figura 33. Diagrama de barras para la variable tamaño 54 Figura 34. Correlograma para las variables del estudio 54 Figura 35. Diagrama de barras según conjunto de muestras 56 Figura 36. Gráfico de “Threshold” vs poder predictivo 57 Figura 37. Estimación de lambda LASSO mediante validación cruzada y AUC 58 Figura 38. Estimación de lambda RIDGE mediante validación cruzada y AUC 59 Figura 39. Precisión del modelo según el número de vecinos en el modelo kNN 64 Figura 40. Ejemplo de clasificación mediante hiperplanos en SVM 64 Figura 41. Curva ROC muestra de entrenamiento de la SVM con kernel Radial 65 Figura 42. Importancia de las variables para el modelo Random Forest 66 Figura 43. Curvas ROC para los para los modelos interpretables 68

4

0. INTRODUCCIÓN La investigación acerca del problema de clasificación de fracaso empresarial inició en los años 1960’s con el esquema Z-Score de Altman, y desde entonces se han desarrollado modelos estadísticos cada vez más complejos con el propósito de realizar predicciones cada vez más precisas acerca de la supervivencia de una organización. Sin embargo, estos modelos con frecuencia no son fácilmente interpretables y no permiten conocer cuál es la importancia de las variables explicativas sobre la quiebra. En este trabajo se diseñó y aplicó una metodología específica que emplea modelos estadísticos y herramientas de ingeniería industrial para realizar la clasificación de una forma interpretable y con un alto poder predictivo, para empresas PYME del sector manufactura de Bogotá. De los ocho modelos estadísticos construidos, se encontró que el modelo de regresión logística con penalización LASSO es clasificador más apropiado con un AUC de 0.885, que es un 6.5% superior comparativamente con el mejor modelo encontrado en la literatura. A partir de este modelo, se determinó que las empresas con un nivel de endeudamiento alto y baja rotación de activos, son más propensas a fracasar; así mismo, aquellas organizaciones que se categorizan como “pequeñas” dentro de la regulación colombiana tienen mayores probabilidades de quiebra que las que pertenecen a otras categorías desde el punto de vista estadístico. Este trabajo contribuye a la discusión respecto a la problemática de fracaso empresarial y puede ser empleado como referencia por entidades financieras o agrupaciones gremiales interesadas en conocer si una empresa está en riesgo de quebrar.

5

1. DESCRIPCIÓN GENERAL DEL PROBLEMA Y DEL TRABAJO DE TESIS 1.1. Contexto general del problema Las pequeñas y medianas empresas, conocidas también como PYMES, tienen un alto impacto en el desarrollo económico de los países, principalmente por el aporte en la creación de puestos de trabajo, aumento en la capacidad de producción, la promoción del emprendimiento y el dinamismo en los distintos sectores de la economía (Lupiañez, Bergamini, & López-Cózar-Navarro, 2014). A raíz de ésta importancia, se han realizado diversos estudios enfocados al análisis de este tipo de organizaciones, con el objetivo de (1) conocer sus principales características, tales como tamaño, ingresos recibidos, valor de activos, etc. y (2) entender las problemáticas que las afectan, por ejemplo, alta variabilidad en la demanda, innovación insuficiente, baja liquidez, entre otros. La alta mortalidad de las PYMES se destaca como un efecto común resultante de dichas situaciones problemáticas. Este fenómeno es conocido en la literatura como fracaso empresarial (Gómez-Núñez et al., 2018) Los estudios realizados hasta la fecha acerca del fenómeno de fracaso empresarial en las organizaciones se han mostrado desde varias perspectivas, como muestra el trabajo recopilatorio realizado por (Rivera Rodríguez, 2012), destacando dos vertientes principalmente: las enfocadas a la explicación fundamentalmente mediante análisis cualitativos y las orientadas a la predicción que emplean modelos matemáticos y estadísticos. Sin embargo, ambas posturas carecen de una comprensión holística de los factores asociados a la supervivencia empresarial, entendida como el opuesto del fracaso empresarial, puesto que los modelos existentes rara vez tienen en cuenta la estratificación de las organizaciones según su tamaño o sector económico. De acuerdo a datos de Confecámaras, en América Latina, más de la mitad de las empresas nuevas, fracasan en los primeros cinco años. De hecho, esta problemática depende del país que se analice, por ejemplo, para el mismo intervalo de tiempo en México el 30% de las sociedades creadas fracasan, mientras que en Colombia fracasa el 40% (Confecamaras: Red de cámaras de comercio, 2017). Particularmente en Colombia, el sector de manufactura contribuyó con el 13.5% del PIB para el año 2015 (cita del DANE). En el año 2018, las PYMES representan alrededor del 97% del parque empresarial manufacturero de Bogotá, ciudad en la que las empresas tienen mayor probabilidad de supervivencia (Romero Espinosa, Molina Melgarejo, & Vera-Colina, 2015). La categoría de pequeña empresa tiene la mayor participación en el total de organizaciones asociadas al sector manufacturero, seguida de las microempresas, esta distribución se muestra en la Figura 1.

Figura 1. Distribución según categoría empresarial sector manufactura año 2018

Fuente: Elaboración propia a partir de datos de EMIS University

40%

45%

12%

3%

MICROEMPRESAS PEQUEÑA MEDIANA GRANDE

6

Sin embargo, en el periodo enero-septiembre se muestra que 105 organizaciones no han logrado sobrevivir, de las cuales el 48.6% pertenecen a la categoría de pequeña empresa (Emis University, 2018). La Figura 2, resume la cantidad de empresas bogotanas del sector manufacturero que han fracasado según categoría.

Figura 2. Cierre empresarial a Septiembre/2018

Fuente: Elaboración propia a partir de datos de EMIS University

El 48.6% de estas organizaciones que no han logrado sobrevivir pertenecen a la categoría de pequeña empresa. En el año 2018, dicha categoría tiene la mayor participación en el total de empresas asociadas al sector manufacturero, específicamente en la ciudad de Bogotá, tal como se muestra en la Figura 2. 1.2. Pregunta de investigación De acuerdo a lo mencionado anteriormente se formula la siguiente pregunta de investigación: ¿cuáles son los factores más significativos que permitan explicar y predecir la supervivencia empresarial de una empresa PYME de la ciudad de Bogotá del sector manufacturero? 1.3. Justificación Es necesario combinar los dos enfoques: explicación y predicción, para poder establecer un punto de partida para la mitigación del fracaso empresarial. De este modo se podrían realizar propuestas de mejoramiento más eficaces. La investigación propuesta pretende emplear herramientas de ingeniería industrial para explicar y predecir la supervivencia empresarial. Para lograrlo se enfocará el análisis en las empresas PYME, actualmente más visiblemente propensas a fracasar en el sector manufacturero, y la ciudad de Bogotá.

MICROEMPRESAS PEQUEÑA MEDIANA GRANDE

2018 31 51 19 4

0

10

20

30

40

50

60

TO

TA

L E

MP

RE

SA

S

7

2. OBJETIVOS A continuación, se exponen el objetivo general y los objetivos específicos asociados a entregables dentro del marco del trabajo de investigación. 2.1. General Formular una metodología de análisis de las decisiones que permita clasificar e interpretar los factores que afectan la supervivencia empresarial en las PYMES del sector manufactura de la ciudad de Bogotá. 2.2. Específicos

Desarrollar un marco conceptual para la caracterización del fracaso empresarial.

Realizar un diagnóstico acerca del fracaso empresarial en el sector manufactura de la ciudad de Bogotá.

Diseñar una metodología específica basada en Análisis de las Decisiones que permita clasificar de forma interpretable si una PYME va a fracasar.

Aplicar la metodología específica y realizar un análisis de los resultados de la aplicación de la metodología.

Producir conclusiones y recomendaciones respecto al trabajo realizado.

8

3. MARCO CONCEPTUAL En este tercer capítulo se establece la definición del concepto de fracaso empresarial, luego se muestra la clasificación de empresas en Colombia se y finalmente se plantea el enfoque conceptual asociado al problema de investigación. 3.1. Definiendo el fracaso empresarial De acuerdo con (Ropega, 2011) el fracaso empresarial es un fenómeno que se encuentra transversal a cualquier tipo de organización, afectando en particular a las empresas pequeñas, dado que estas no disponen de los mismos recursos comparativamente con aquellas de mayor envergadura. Además, varios autores destacan que no hay un consenso en la literatura sobre la definición exacta del término fracaso empresarial; esto es debido a la diversidad de los datos con que los investigadores realizan sus estudios (Cameron, Sutton, & Whetten, 1988; Sharma & Mahajan, 1980). Un resumen de las definiciones encontradas en la literatura se muestra en la Tabla 1.

Tabla 1. Algunas definiciones de fracaso empresarial

AUTOR TÉRMINO DEFINICIÓN

(Altman, 1968) Fracaso Empresas clasificadas como financieramente en quiebra.

(Argenti, 1976) Colapso corporativo Empresas que quebraron y han salido del mercado.

(Cameron et al., 1988) Fracaso organizacional Deterioro de la adaptación de la organización hacia su nicho de mercado y pérdida de recursos.

(Carroll & Hannan, 1989; Hannan & Freeman, 1988)

Mortalidad organizacional Salida prematura del mercado por errores de administración.

(D’Aveni, 1989) Insolvencia Rentabilidad negativa después del ejercicio contable.

(Duncan & Handler, 1994) Bancarrota Firma en quiebra con deudas pendientes con sus acreedores.

(Harrigan, 1982) Fracaso organizacional Reducción de la participación en el mercado.

(Lussier, 1995) Fracaso empresarial Eventos que conllevan a la liquidación voluntaria o involuntaria.

(Mellahi & Wilkinson, 2004) Fracaso organizacional Empresas que han salido del mercado de forma prematura por bancarrota o cierre voluntario.

(Platt & Platt, 2004) Fracaso Entendido como fracaso financiero o quiebra.

(Rivera Rodríguez, 2012) Perdurabilidad empresarial Organizaciones que han sido viables financieramente por un periodo de tiempo específico.

(Romero Espinosa et al., 2015)

Fracaso empresarial Insolvencia económica.

(Sanabria Landazábal, 2012) Fracaso empresarial Quiebra empresarial.

(Stead & Smallman, 1999) Cierre empresarial Cierre por crisis financiera.

Fuente: Elaboración propia Aunque existan diferentes formas para denominar al fracaso empresarial tales como fracaso organizacional, bancarrota, mortalidad organizacional, insolvencia, entre otros, la tabla anterior muestra que la mayoría de los autores la considera una problemática asociada a la quiebra financiera. En el presente trabajo de tesis, se entenderán empresas víctimas de fracaso empresarial aquellas que han sido cerradas por quiebra. En Colombia existen legalmente tres figuras que son afines al concepto de fracaso empresarial: liquidación obligatoria, concordato y liquidación judicial. Estas figuras que se encuentran reguladas

9

por la Superintendencia de Sociedades, son clasificaciones que han cambiado a través de los años según diversas normas, pero que resumen a organizaciones que no han logrado sobrevivir en el mercado. La información financiera asociada a las organizaciones que se pueden clasificar en tales categorías, se encuentra disponible al público para consulta en la web de la Superintendencia de Sociedades (http://pie.supersociedades.gov.co/Pages/default.aspx). 3.2. Clasificación de empresas en Colombia Las empresas son clasificadas en Colombia bajo las directrices plasmadas en la Ley 905 de 2004 (Congreso de la República de Colombia, 2004), en las que se establecen dos criterios para identificar a una organización dentro de la categoría de PYME, estos son cantidad de empleados y activos totales. En la Tabla 2 se muestra el resumen de los criterios:

Tabla 2. Clasificación de empresas según normativas colombianas

DESCRIPCIÓN CANTIDAD DE TRABAJADORES ACTIVOS TOTALES EN

SMMLV1

Microempresa Menos de 10 Menos de 500

Pequeña empresa Entre 11 y 50 Entre 501 y 5000

Mediana empresa Entre 51 y 200 Entre 5001 y 30000

Fuente: (Congreso de la República de Colombia, 2004)

En junio de 2019, el Ministerio de Comercio, Industria y Turismo expidió el Decreto 957 de 2019, a través del cual se establece una clasificación para las empresas en Colombia, basado en los ingresos anuales por actividades ordinarias, desplazando la clasificación actual de empresas descrita anteriormente. Esta nueva reglamentación empezará a regir a partir del mes de diciembre de 2019, y se encuentra resumida en la Tabla 3.

Tabla 3. Nuevo esquema de clasificación por sector

TAMAÑO MANUFACTURA SERVICIOS COMERCIO

Micro Hasta 811 Hasta 1131 Hasta 1535

Pequeña Desde 811 hasta 7027 Desde 1131 hasta 4523 Desde 1535 hasta 14781

Mediana Desde 7027 hasta 59527 Desde 4523 hasta 16558 Desde 14781 hasta 74066

Grande Desde 59527 Desde 16558 Desde 74066

*Cifras en millones de pesos colombianos del año 2019 Fuente: Ministerio de Comercio, Industria y Turismo, 2019

Así, mismo vale la pena mencionar que la gran mayoría de empresas de Colombia se encuentran constituidas bajo contratos de sociedad, según lo establecido en el Artículo 98 del Código de Comercio y la Ley 1258 de 2008, este tipo de sociedades se describe en la Tabla 4.

Tabla 4. Tipos de empresas por sociedades en Colombia

TIPO DE SOCIEDAD RAZÓN SOCIAL DESCRIPCIÓN

Anónima S.A. Se requieren de mínimo de cinco accionistas, que limitan su responsabilidad a los aportes realizados en su constitución.

Colectiva & Cía.

Es el más antiguo, conformado por un mínimo de dos socios, los cuales tienen una responsabilidad ilimitada y solidaria; adicionalmente, sus votos tienen siempre la misma importancia.

Comandita simple Soc. Comandita

Compuestas por socios comanditarios y socios gestores, que comparten la responsabilidad de la gestión directiva, sin embargo recae en los gestores la responsabilidad económica.

1 SMMLV, siglas para salario mínimo mensual legal vigente, que en Colombia para el año 2019 equivale a 828.116 COP.

10

TIPO DE SOCIEDAD RAZÓN SOCIAL DESCRIPCIÓN

Comandita por acciones Soc. Comandita

Es un híbrido entre la sociedad en comandita simple y la sociedad anónima, cuyos socios comanditarios y gestores realizan sus aportes en forma de acciones.

Limitada Ltda.

Son necesarios entre 2 y 25 socios cuyos aportes deben ser cuotas de igual valor y tienen responsabilidad limitada hasta el monto de dichos aportes.

Sociedad por acciones simplificada S.A.S.

Surge del interés de los emprendedores de proteger sus capitales personales en caso de bancarrota, es una versión más flexible de la sociedad anónima.

Fuente: Elaboración propia

3.3. Enfoque conceptual La investigación desarrollada en este documento busca emplear herramientas estadísticas que permitan predecir si una empresa PYME de la ciudad de Bogotá, perteneciente al sector económico manufacturero va a caer en la categoría de fracaso empresarial. Sin embargo, tal como se mencionó en el Capítulo 1, al aplicar este tipo de herramientas existe un desbalance entre la capacidad de explicar el porqué de la ocurrencia de un fenómeno y la precisión con la que se predicen los resultados; lo anterior, ocasionado por que aquellos que quieren predecir solamente se enfocan en mejorar las medidas de desempeño del modelo, mientras que los que buscan explicar simplemente buscan las relaciones de causalidad entre las variables independientes y de respuesta, independientemente de la capacidad de predicción resultante de su interacción. El Análisis de Decisiones es una disciplina que combina un grupo de herramientas, procedimientos y métodos para minimizar el margen de error al momento de tomar decisiones, como por ejemplo determinar si una organización está en riesgo o no de fracaso. Esto se logra mediante la estructuración de las variables predictores, aspectos y condiciones de un problema que comporta riesgo y la aplicación de metodologías específicas que satisfagan las preferencias de los decisores (Castillo, 2017). Por lo tanto, en este trabajo de investigación, se hará uso de la metodología de Análisis de Decisiones para diseñar modelos de clasificación que balanceen la precisión con que se predice si una empresa PYME va a fracasar y la interpretabilidad de los factores que impiden su supervivencia. 3.3.1. Modelos de clasificación Los problemas de clasificación son aquellos en los que la variable de respuesta es de tipo categórico, por ejemplo: “enfermo” y “sano”, o “rojo”, “amarillo” y azul”. Se diferencian de los problemas de regresión, dado que en los últimos la variable de respuesta es un valor numérico. En estos modelos, el objetivo es utilizar observaciones conocidas de variables predictoras, para clasificar con los distintos niveles de la variable de respuesta otro nuevo grupo de observaciones (Müller & Guido, 2016). A continuación, se describen algunas de las herramientas más frecuentemente empleadas en problemas de clasificación estadística:

Regresión logística La regresión logística es un método de clasificación de uso frecuente para representar conjuntos de datos cuya variable de respuesta es discreta. El objetivo es el mismo que cuando se emplean métodos convencionales de regresión en estadística, que es, encontrar el modelo que mejor describa

11

la relación entre una variable de salida o de respuesta y un grupo de variables explicativas o predictoras (Hosmer, Lemeshow, & Sturdivant, 2013) Cuando se trata con una variable de respuesta dicotómica 𝑌, la regresión logística busca modelar la

probabilidad de que 𝑃(𝑌 = 1) o 𝑃(𝑌 = 0), dando resultado a la siguiente ecuación:

𝑃(𝑌 = 1) =𝑒𝛼+𝛽1𝑋1+𝛽2𝑋2+⋯𝛽𝑘𝑋𝑘

1 + 𝑒𝛼+𝛽1𝑋1+𝛽2𝑋2+⋯𝛽𝑘𝑋𝑘

De esta manera se asegura que el resultado de la conjunción de todas las variables tenga como resultante un valor de cero (0) o uno (1). Esta herramienta se adapta a la situación problemática del presente trabajo de tesis, dado que se busca caracterizar una variable de respuesta dicotómica (supervivencia o fracaso empresarial) a partir de un conjunto finito de variables explicativas. Como ventajas se destaca que es un modelo relativamente sencillo y ampliamente empleado por científicos en diversos contextos, cuyas aplicaciones frecuentemente no requieren de alta capacidad computacional y disponible en casi cualquier software de análisis estadístico. Una de las desventajas es que los datos deben ser linealmente separables, es decir que los datos de la variable de respuesta deben ser mutuamente excluyentes, de lo contrario la representación de modelado no tendría validez estadística.

RIDGE Las metodologías LASSO y RIDGE son penalizaciones a la regresión logística mencionada anteriormente, cuyo objetivo es mejorar la capacidad predictiva y reducir el riesgo de sobreajustar los coeficientes (𝛽).

La técnica RIDGE, buscar darle a cada coeficiente estimado un valor diferente a cero, esto es ��𝑖 ≠0. De esta manera no hay una selección de variables dentro del algoritmo del modelo, lo que le da una mayor interpretabilidad (Tibshirani, 1996)(T. Hastie, Tibshirani, & Friedman, 2009). La forma de estimar los coeficientes comparativamente con la estimación de mínimos cuadrados se muestra en la Tabla 5.

Tabla 5. Estimación de coeficientes

ESTIMACIÓN POR MÍNIMOS CUADRADOS ESTIMACIÓN POR RIDGE

��𝑅 = (𝑿𝑻𝑿)−𝟏𝑿𝑻𝒀 ��𝑅 = (𝑿𝑻𝑿 + 𝜆𝑰)−𝟏𝑿𝑻𝒀 Fuente: Adaptado de (Valencia, 2018)

Donde X representa la matriz de variables predictoras, I la matriz identidad y Y el vector de variables

de respuesta. El parámetro 𝜆 es un factor de regularización, concebido para que al incrementarse

los valores de los coeficientes (𝛽) se penalize la función de optimización. Este método se conoce también como de “encogimiento”, puesto que fomenta la reducción de la varianza total y los problemas de multicolinealidad, al limitar el tamaño que toman los coeficientes. Tiene como desventajas, que requiere una mayor capacidad computacional puesto que debe calcularse el valor óptimo que requiere el parámetro 𝜆 mediante validación cruzada (“cross-validation”).

LASSO LASSO fue desarrollada por (Tibshirani, 1996), con el propósito de reducir el número de variables, la estimación de los coeficientes de las variables se realiza a partir de la siguiente ecuación:

12

��𝐿𝐴𝑆𝑆𝑂 = arg min𝑏=(𝑏1,…,𝑏𝑝)∈ℝ𝑃

∑(𝑌𝑖 − 𝑏𝑇𝑋𝑖)2 + 𝜆 ∑|𝑏𝑗|

𝑝

𝑗=1

𝑛

𝑖=1

La reducción de variables se logra haciendo que los coeficientes de las variables menos representativas sean cero. Si el parámetro 𝜆 = 0, se tendrá una regresión logística común, mientras que si este se hace lo suficientemente grande, implicará que todos los coeficientes sean iguales a cero. El atractivo de esta metodología de clasificación es su capacidad inherente para la selección de variables, resultando en un modelo que representa la situación problemática con la menor cantidad de predictores posible. Sin embargo, al hacerlo se reduce la interpretabilidad de la herramienta de clasificación. Al igual, que RIDGE, esta metodología requiere de la aplicación de validación cruzada para determinar el valor óptimo del parámetro de regularización 𝜆.

Análisis discriminante multivariado El análisis multidiscriminante es una herramienta de clasificación, también conocido en literatura de reconocimiento de patrones como aprendizaje supervisado. Se utiliza para separar conjuntos de datos que pueden encontrarse ocultos bajo el enfoque de una regresión lineal, como se ilustra en la Figura 3.

Figura 3. Comparación entre regresión lineal y análisis discriminante

Fuente: (T. Hastie et al., 2009)

A partir conjuntos de datos disponibles, la regla para clasificar una observación x en una de dos categorías, Π1 o Π2 es la que asigne x a Π1 si se cumplen las condiciones de Fischer (Gnanadesikan, R., 1988). Existen distintos métodos de análisis discriminante, sin embargo los más representativos son, el análisis discriminante lineal (LDA por sus siglas en inglés), el análisis discriminante cuadrático (QDA), la predicción usando vecinos más cercanos (k-nn) y las máquinas de soporte vectorial (SVM). Estas herramientas tienen como ventaja el ser robustas, por otra parte, su desventaja es la pérdida de representación o interpretabilidad, dado que los algoritmos empleados sacrifican esta propiedad para lograr resultados más precisos. Así mismo, algunos de estos modelos requieren que las varibales predictoras cumplan una serie de supuestos tales como Normalidad y baja correlación entre variables.

13

Árboles de clasificación Los árboles de clasificación buscan separar el espacio de datos que representa un problema en rectángulos, y luego ajustar un modelo sencillo para cada uno de los rectángulos resultantes, un ejemplo de esta técnica se muestra en la Figura 4. Se trata de una herramienta especialmente útil para ajustar modelos de clasificación con variables de respuesta discretas y no depende del cumplimiento de los supuestos que las aproximaciones lineales requieren, tales como normalidad e insesgamiento.

Figura 4. Ejemplo de fraccionamiento de espacio mediante árboles de clasificación

Fuente: (T. Hastie et al., 2009)

Algunos de los limitantes para el uso de esta herramienta de modelaje están asociados a la naturaleza de las variables explicativas, dado que si son de tipo categórico el tiempo de cómputo para el análisis aumentará considerablemente comparativamente con variables de tipo continuo, a razón de la necesidad de crear más ramificaciones en el modelo de solución.

Modelos aditivos generalizados (GAMS) Este tipo de modelos fueron propuestos por (T. J. Hastie & Tibshirani, 1990; T. Hastie & Tibshirani, 1986) como una alternativa a los modelos regresivos y de clasificación disponibles hasta los años 80’s, los cuales dependían de una relación de dependencia lineal entre las variables explicativas y la respuesta. El resultado fue la definición de una función aditiva que pudiese representar de mejor forma dicha relación, particularmente en problemas de clasificación:

log (𝜙(𝑥)

1 − 𝜙(𝑥)) = 𝛼 + 𝑓1(𝑋1) + ⋯ + 𝑓𝑘(𝑋𝑘)

Esta herramienta de modelaje, requiere que las k funciones deban ser estimadas simultáneamente, incurriendo en un costo computacional elevado, con resultados que tienen a ser cada vez menos satisfactorios en términos de capacidad de predicción según se incremente el número de variables predictoras, dado que estas contribuyen a aumentar la varianza.

Modelos de ensamble Los modelos de ensamble o “stacking” han sido desarrollado en las últimas décadas con el surgimiento de los algoritmos de aprendizaje, conocidos también como “machine learning” y su objetivo es aumentar el poder predictivo de los clasificadores. Dentro de estos modelos se puede encontrar “Random Forest”, “Gradient Boosting”, “Extreme Gradient Boosting”, entre otros.

14

La principal característica de estos modelos es que son de tipo caja negra, es decir, tienen una interpretabilidad, con un muy alto nivel de precisión en cuanto poder predictivo. Esta característica los hace atractivos para los investigadores que no tienen interés sobre las relaciones de causalidad entre los predictores y la variable de respuesta.

Figura 5. Ejemplo de modelos caja negra

Fuente: https://www.sigesa.com/interpretabilidad-vs-causalidad-son-lo-mismo/?lang=en

3.3.2. Interpretabilidad vs Poder predictivo A principios de la década de los 90’s (March, 1991) realizó una investigación denominada “Exploración y explotación en el aprendizaje organizacional” cuyo propósito es mostrar que el esfuerzo por obtener resultados (explotación) frecuentemente va en sentido contrario a la búsqueda de las razones que permiten llegar a dichos resultados (exploración). Lo anterior tiene relevancia en el contexto del fracaso y supervivencia empresarial, puesto que, si bien se han desarrollado diversos estudios tanto para explicar como para predecir el fenómeno, rara vez se ha intentado abordar esta problemática desde las dos perspectivas. En la Figura 6, se expone la relación entre las dos propiedades de los modelos de clasificación descritos con anterioridad, basadas en un escalafón con rango entre 1 y 10 para ambas; siendo 1 el nivel más bajo y 10 el nivel más alto.

15

Figura 6. Comparación de propiedades explicativas y predictivas en modelos de clasificación

Fuente: Adaptado de (Rane, 2018)

3.3.3. Medidas de desempeño La construcción de los modelos de clasificación se realiza mediante la separación de los datos disponibles en dos subconjuntos: (1) entrenamiento y (2) prueba. El conjunto de entrenamiento se utiliza para calibrar los coeficientes y parámetros de los modelos, mientras que el conjunto de prueba es empleado para evaluar el desempeño predictivo de la herramienta.

Matriz de confusión Cuando se tienen dos posibles categorías en la variable de respuesta, es posible evaluar la información completa de los errores del modelo empleado. La Figura 7 muestra un ejemplo de la matriz de confusión, cuyo objetivo es mostrar cuantas observaciones fueron correctamente clasificadas y cuantas están erradas. En el presente trabajo de investigación la variable de respuesta es categórica, y se entenderá como “Positivo” aquellas organizaciones que han fracasado, mientras que el resto se considerará “Negativo”.

Regresión logística

Árboles de decisión

Clustering

Kernels

Métodos de ensamble

Redes neuronales

Modelos aditivos

1

2

3

4

5

6

7

8

9

10

1 2 3 4 5 6 7 8 9

PO

DE

R P

RE

DIC

TIV

O

INTERPRETABILIDAD

MÉTODOS DE CLASIFICACIÓN

16

Figura 7. Ejemplo de una matriz de confusión

Fuente: Tomado de (Valencia, 2018)

A partir de la construcción de esta matriz, se pueden realizar varias medidas de resumen tales como la especificidad y la sensibilidad.

Especificidad La especificidad, indica en este caso, la probabilidad de que una empresa que no ha fracasado sea clasificada como no fracasada. Se calcula mediante la siguiente ecuación:

𝐸𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑑𝑎𝑑 =𝑉𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑜𝑠 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑜𝑠

𝑉𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑜𝑠 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑜𝑠 + 𝐹𝑎𝑙𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜𝑠

El objetivo de esta medida es que sea lo más cercana a 1, al igual que la sensibilidad.

Sensibilidad La sensibilidad, hace referencia a la probabilidad de clasificar a una empresa fracasada como verdaderamente fracasada. Se calcula mediante la siguiente ecuación:

𝑆𝑒𝑛𝑠𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑 =𝑉𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑜𝑠 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜𝑠

𝑉𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑜𝑠 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜𝑠 + 𝐹𝑎𝑙𝑠𝑜𝑠 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑜𝑠

Exactitud o “accuracy” La exactitud del modelo se refiere a la capacidad que este tiene para clasificar correctamente en las dos categorías de la variable de respuesta, los datos de la muestra de prueba.

𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 =(𝑉𝑁 + 𝑉𝑃)

𝑉𝑃 + 𝑉𝑁 + 𝐹𝑁 + 𝐹𝑃

Área bajo la curva ROC Aunque las medidas anteriores son útiles para evaluar el comportamiento predictivo del modelo de clasificación, existe otra más aceptada: el área bajo la curva ROC. La cuál como se muestra en la Figura 8, relaciona la sensibilidad y la especificidad. Esta medida de desempeño permite comparar de una forma más completa el poder predictivo de las herramientas de clasificación.

17

Figura 8. Ejemplo de Curva ROC

18

4. REVISIÓN DE LITERATURA El consenso en la literatura respecto a los estudios realizados para identificar y diagnosticar el fracaso empresarial es que el foco ha estado constantemente separado entre la construcción de modelos explicativos y modelos predictivos (Crutzen & Caillie, 2008; Mellahi & Wilkinson, 2004; Shonesy & Gulbro, 2019), a continuación se muestra los principales resultados del trabajo de diversos autores en el esfuerzo por analizar el fenómeno de fracaso empresarial. 4.1. Modelos explicativos para el diagnóstico de fracaso empresarial

(Ropega, 2011) The Reasons and symptoms of failure in SME Éste trabajo busca recopilar elementos comunes en la literatura para analizar los patrones que pueden conllevar a las organizaciones al fracaso empresarial. Identifican al emprendedor o grupo de emprendedores que inician la compañía como el factor más representativo en la supervivencia o fracaso de las PYME’s; particularmente, se enfatiza que se depende en gran medida de las habilidades de gerencia y la cantidad de capital invertido.

(Bushe, 2019) The causes and impact of business failure among small to micro and medium enterprises in South Africa

En este artículo se analizan las causas del fracaso empresarial en empresas PYME de Sudáfrica, a partir de un extenso análisis PESTEL (político, económico, social, tecnológico, ecológico y legal) y sintetiza que los factores más relevantes se dividen en dos componentes: factores internos, tales como la motivación del emprendedor que creó la compañía, la existencia de un plan de negocios y las habilidades de administración de recursos; en segunda instancia, están los factores externos, de los cuáles destaca la competencia y la variabilidad del sector económico.

(Mellahi & Wilkinson, 2004) Organizational failure: a critique of recent research and a proposed integrative framework

En el estudio se busca integrar un marco de referencia para unir varias posturas encontradas a lo largo de la literatura, dado que existen brechas entre la teoría y la práctica en el fenómeno de fracaso empresarial. Los autores plantean que los principales factores asociados son: (1) ambientales / ecológicos asociados a las condiciones externas de la empresa y (2) organizacionales relacionados directamente con la gerencia de los recursos disponibles (físicos, humanos, entre otros).

(Richardson, Nwankwo, & Richardson, 1994) Understanding the Causes of Business Failure Crises: Generic Failure Types

Los autores definen a una empresa que está en fracaso organizacional como aquella que se volverá insolvente a menos que se tomen las acciones adecuadas para mejorar su desempeño financiero. En la Figura 9, se muestra la conclusión más relevante del estudio de Richardson, en la cual el autor asevera que la crisis organizacional se debe a la incapacidad de adaptarse a los cambios del entorno externo de la organización, por políticas internas que no apuntan en la misma dirección. Esta brecha causa que las empresas no estén alineadas con las expectativas de sus stakeholders, disminuyendo entonces su participación en el mercado hasta desaparecer.

19

Figura 9. Desviación en organizaciones que conduce a crisis

Fuente: (Richardson et al., 1994)

4.2. Modelos cuantitativos para el diagnóstico del fracaso empresarial

(Sharma & Mahajan, 1980) Early warning indicators in business failure Los autores proponen un análisis multidiscriminante para determinar la probabilidad de fracasar basados en variables financieras, específicamente la razón de retorno sobre los activos (ROA) y la razón corriente para organizaciones durante un periodo de cinco años. Además, indican que bajo éste modelado es posible predecir si existe o no fracaso a futuro, pero no posibilitan la identificación de las causas subyacentes que los han llevado a la no supervivencia. El modelo predictivo tiene una precisión o “accuracy” de 0.807.

(Islam & Tedford, 2012) Risk determinants of Small and Medium-sized Manufacturing Enterprises (SMEs)-an exploratory study in New Zealand

El estudio está enfocado hacia la identificación de los determinantes típicos del riesgo en PYMES, considerando por parte de los autores como insumo fundamental para administrar el riesgo de fracaso de forma integral. En este artículo se emplea con frecuencia el término perturbación para referirse a aquellos eventos no deseados que ocasionan desviaciones en el desempeño del sistema (y finalmente al fracaso); en síntesis, estos factores son separados en dos categorías: internos y externos; la Tabla 6 muestra el resumen de la clasificación.

Tabla 6. Resumen de factores organizacionales (Islam & Tedford, 2012)

FACTORES EXTERNOS FACTORES INTERNOS

1. Competencia 2. Cadena de suministro deficiente 3. Personal capacitado 4. Fluctuación de la demanda 5. Obstáculos financieros 6. Regulaciones gubernamentales

1. Ausentismo de trabajadores 2. Problemas de calidad 3. Disponibilidad de materia prima 4. Administración de recursos 5. Mantenimiento

Fuente: (Islam & Tedford, 2012) Una de las características de este estudio es que no tiene en cuenta únicamente variables de tipo financiero, sino que considera además la intervención gubernamental, la habilidad del emprendedor para administrar su negocio. Sin embargo, es un claro ejemplo de aquellos estudios que buscan explicar el fenómeno, pero no realizan aproximaciones prácticas para determinar si sus conclusiones son válidas.

20

(Kosmidis & Stavropoulos, 2014b) Corporate failure diagnosis in SME A partir de un análisis discriminante múltiple y métodos de regresión logística (logit y probit) se modelan las variables que, de acuerdo con los autores, aumentan la precisión en el diagnóstico de fracaso empresarial en pequeñas y medianas empresas en Grecia. Se destaca que el estudio se construyó bajo la hipótesis de que los estudios existentes se enfocan principalmente en grandes corporaciones y no en PYMES. Establecen que una de las principales causas de fracaso en empresas está relacionada con la toma de decisiones estratégicas, y específicamente con respuestas a cambios del entorno no apropiadas. Las variables que se usaron en el estudio son razones financieras de utilidad (LEBTPE), viabilidad (ETR), liquidez (RSCR) y actividad (LTCTR), con una precisión general de 0.81.

(Altman, 1968) Financial Ratios and discriminant analysis on bankruptcy prediction El modelo de predicción de fracaso empresarial más aceptado en la comunidad académica es el Z-Score de Altman, que se basa en un análisis discriminante realizado con información de empresas quebradas y sobrevivientes de la industria económica estadounidense. Se compone de cinco variables predictoras y funciona bajo un ranking: si el Z-Score < 1.8, se puede decir que una compañía está en serio riesgo de fracasar. La estructura de este indicador es:

𝑍 − 𝑆𝑐𝑜𝑟𝑒 = 1.2𝑋1 + 1.4𝑋2 + 3.3𝑋3 + 0.6𝑋4 + 1.0𝑋5

𝑋1:𝐶𝑎𝑝𝑖𝑡𝑎𝑙 𝑑𝑒 𝑡𝑟𝑎𝑏𝑎𝑗𝑜

𝐴𝑐𝑡𝑖𝑣𝑜 𝑇𝑜𝑡𝑎𝑙

𝑋2:𝑅𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜 𝑑𝑒𝑙 𝑒𝑗𝑒𝑟𝑐𝑖𝑐𝑖𝑜

𝐴𝑐𝑡𝑖𝑣𝑜 𝑇𝑜𝑡𝑎𝑙

𝑋3:𝐸𝐵𝐼𝑇

𝑃𝑎𝑠𝑖𝑣𝑜 𝑇𝑜𝑡𝑎𝑙

𝑋4:𝑃𝑎𝑡𝑟𝑖𝑚𝑜𝑛𝑖𝑜

𝑃𝑎𝑠𝑖𝑣𝑜 𝑇𝑜𝑡𝑎𝑙

𝑋5:𝑉𝑒𝑛𝑡𝑎𝑠

𝐴𝑐𝑡𝑖𝑣𝑜 𝑇𝑜𝑡𝑎𝑙

4.3. Estudios realizados a nivel nacional A nivel nacional, se han efectuado algunos estudios relacionados con la identificación de las variables que afectan la supervivencia empresarial, a continuación, se mencionan los más relevantes:

Reporte GEM 2018-2018 En el reporte del Global Entrepreneurship Monitor Colombia del 2017-2018 (Gómez-Núñez et al., 2018) se determina que una de las principales razones para salir del mercado, es la quiebra financiera, con el 62.3% del grupo consultado, enfocado a organizaciones de diversos sectores (textiles, curtiembres, industria, minería, etc.).

21

Cuadernos de análisis económico Confecámaras Nº11 y Nº 14 Por su parte Confecámaras elaboró un estudio con datos a nivel nacional para determinar cuáles son las razones para que las organizaciones no sobrevivan: encontrando que los tres macrofactores son la localización geográfica, los indicadores financieros del flujo de caja de la propuesta inicial y la variabilidad del sector económico en el que se desarrollan las actividades misionales (Confecamaras: Red de cámaras de comercio, 2017). La Figura 10 resume los hallazgos descritos:

Figura 10. Determinantes de la supervivencia empresarial

Fuente: (Confecamaras: Red de cámaras de comercio, 2017).

(Romero Espinosa et al., 2015) Fracaso empresarial de las pequeñas y medianas empresas

en Colombia El trabajo utilizó la base de datos de la Superintendencia de Sociedades para clasificar empresas sanas y fracasadas y una muestra de 96 organizaciones, empleando razones financieras que resumen la situación financiera de la organización. Estas razones son: razón de endeudamiento, razón corriente y rentabilidad del patrimonio. Los hallazgos más relevantes incluyen la identificación de la ciudad de Bogotá D.C. como aquella con mayor proporción de empresas sanas en Colombia con el 72.9% de las cuáles el 68.8% pertenecen a la categoría de PYME.

(Angel & Pulido, 2010) El éxito de las pymes en Colombia : estudio de caso en el sector salud

Los autores buscan identificar y analizar los factores que determinan el éxito de las PYMES en Colombia, mediante un análisis cualitativo basado en el marco conceptual de la teoría de recursos y capacidades, así como la teoría económica institucional. El modelo empleado es:

É𝑥𝑖𝑡𝑜 = 𝑓(𝐹𝐼, 𝐹𝐸) Dónde FI representa los factores internos tales como los recursos tangibles, intangibles y humanos, capacidad operacional; mientras que los FE son factores externos que se asocian a la normatividad, las condiciones de la industria sectorial y la cultura organizacional. Mencionan además que una

22

posible razón para la estabilidad detectada en las empresas del sector salud, sea la dificultad de ingresar al mercado por las regulaciones existentes actualmente.

(Parra, 2011) Determinantes de la probabilidad de cierre en Pymes de la ciudad de Bogotá Este trabajo emplea el método de regresión logística para modelar datos de la Superintendencia de Sociedades acerca de empresas que han quebrado. Las variables de entrada son en su mayoría financieras, tales como activos, utilidades operacionales, patrimonio y pasivo. Este estudio concluye que la clasificación de mediana empresa tiene mayor oportunidad de sobrevivir en el entorno económico bogotano; además, revela que las empresas más proclives a quebrar son las microempresas y aquellas que tienen un nivel de endeudamiento alto.

(Santana, 2017) Determinantes de la supervivencia de microempresas en Bogotá: un análisis con modelos de duración

Este estudio emplea información financiera recopilada por la Cámara de Comercio de Bogotá al momento de la constitución de varias empresas, por ejemplo, el capital social, los activos totales y el tipo de sociedad constituida. El resultado es una función de supervivencia de Kaplan-Meier que tiende a estabilizarse luego del octavo año de funcionamiento de las empresas, con una tasa de supervivencia del 55,3%. Adicionalmente el autor, emplea un modelo regresivo Weibull para concluir que factores como el retorno a la inversión, la figura jurídica (S.A.S, Ltda, etc.), la cantidad de personas que se encuentran trabajando en la organización y el nivel de endeudamiento son las variables que influyen significativamente en la supervivencia de las microempresas de Bogotá.

(Ramirez, 2017) GAMSEL methodology application to provide a balance between interpretability and flexibility in the bankruptcy prediction problem

Este trabajo fue realizado en la Universidad de los Andes, aplicando la metodología GAMSEL, la cual es una extensión al modelo desarrollado por (T. Hastie & Tibshirani, 1986) cuyo objetivo es integrar una selección de variables dentro del algoritmo GAMS (Modelos aditivos generalizados). Este trabajo emplea como referencia los predictores del Z-Score de Altman, así como razones financieras de liquidez, rentabilidad y endeudamiento como variables explicativas. Con un AUC de 0.82 el autor busca demostrar que es posible predecir de forma flexible e interpretable la quiebra financiera de empresas en Colombia. Este trabajo se realizó con información pública disponible en la base de datos la Superintendencia de Sociedades, para una muestra de aproximadamente 3000 empresas de diferentes ciudades y sectores económicos. Esta es una de las aproximaciones más recientes hacia el problema de predicción de fracaso empresarial, aun así, el estudio emplea únicamente predictores de origen financiero, sin tener en cuenta la influencia de la ubicación geográfica y sin discriminar el tamaño de las organizaciones. 4.4. Resumen de la revisión de literatura En la Tabla 7, se hace un resumen de los hallazgos encontrados en la revisión de literatura. Se especifica la naturaleza de las investigaciones, su país de origen, el tipo de herramienta que han empleado para obtener sus conclusiones y los hallazgos más relevantes de cada uno.

23

Tabla 7. Resumen de hallazgos en la literatura sobre fracaso empresarial

AUTOR PAÍS TIPO DE ESTUDIO

MODELOS EMPLEADOS

PRINCIPALES RESULTADOS / HALLAZGOS

(Altman, 1968) Estados Unidos Cuantitativo financiero

Análisis discriminante El principal factor del fracaso empresarial es la liquidez. Se construye el sistema de Z-Score para predecir la quiebra empresarial.

(Angel & Pulido, 2010) Colombia Cualitativo Estudio de casos,

análisis comparativo

Proponen que los factores de éxito en las empresas son una función de factores internos y externos, siendo los principales la disponibilidad de recursos y la dinámica sectorial respectivamente.

(Arasti, Zandi, & Bahmani, 2014) Irán Cualitativo / Cuantitativo

Encuestas, análisis estadístico ANOVA

Los emprendedores cuyos negocios difieren de aquellos que fracasan, en darle mayor importancia al entorno externo de la organización respecto del apoyo financiero del gobierno.

(Bushe, 2019) Sudáfrica Cualitativo /

Teórico Análisis PESTEL

El fracaso es una combinación de factores internos y externos, destacando la variabilidad del sector económico y la habilidad del emprendedor.

(Chittithaworn, Islam, & Muhd Yusuf, 2011)

Tailandia Cualitativo / Cuantitativo

Encuestas, ANOVA La liquidez financiera, el entorno externo y las características propias de la organización (tamaño, cantidad de personal) son los factores significativos para el éxito de las empresas.

(Confecamaras: Red de cámaras de comercio, 2017; Confecámaras: Red

de Camaras de Comercio, 2016) Colombia Cuantitativo

Regresión logística, Duración Weibull

Los tres grandes factores que influyen en la supervivencia empresarial son los internos (tamaño, organización jurídica, finanzas, entre otros), sectoriales y localización geográfica.

(Gómez-Núñez et al., 2018) Colombia Cuantitativo Encuestas y tablas de

contingencia La principal causa para el cierre de empresas es la quiebra financiera.

(Hazlina Ahmad & Seet, 2009) Malasia y Australia

Cualitativo / Teórico

Análisis cualitativo de casos y revisión de

literatura

La habilidad para administrar recursos económicos y de adaptación son las causas que más se repiten entre la muestra analizada.

(Islam & Tedford, 2012) Nueva Zelanda Cuantitativo estadístico

Análisis discriminante

El fracaso se resume en una combinación de factores internos y externos estadísticamente significativos, tales como la competencia, la administración de recursos y la fluctuación de la demanda, entre otros.

(Kosmidis & Stavropoulos, 2014a) Grecia Cuantitativo estadístico

Análisis discriminante múltiple, regresión

logística

La principal causa es la deficiente toma de decisiones estratégicas.

(Mellahi & Wilkinson, 2004) Reino Unido Cualitativo /

Teórico

Análisis cualitativo de casos y revisión de

literatura

Dividen los factores entre externos (ambientales y ecológicos) e internos (organizacionales). El estudio es de tipo teórico y generó un marco de referencia para el análisis de organizaciones en Irán.

(Mihajlović, Schulte, Nikolić, Dhamo, & Kume, 2015)

Varios de Europa del Este

Cuantitativo Encuestas, MUSA Los factores individuales, en especial la disponibilidad de recursos económicos al iniciar el emprendimiento son los que más afecta el éxito o fracaso de una empresa PYME.

24

AUTOR PAÍS TIPO DE ESTUDIO

MODELOS EMPLEADOS

PRINCIPALES RESULTADOS / HALLAZGOS

(Parra, 2011) Colombia Cuantitativo financiero

Regresión logística Mediante regresión logística se demuestra que las microempresas son las más susceptibles a fracasar, así como aquellas con altos niveles de endeudamiento.

(Ramírez Zuluaga, Valencia Arboleda, Torres Cadena, & Handl, 2017)

Colombia Cuantitativo estadístico

Machine learning (GAMSEL)

Es posible realizar predicciones sobre fracaso empresarial empleando modelos flexibles e interpretables, es uno de los estudios pioneros en el país para buscar cerrar la brecha entre interpretabilidad y poder predictivo.

(Richardson et al., 1994) Estados Unidos Cualitativo /

Teórico

Análisis cualitativo de casos y revisión de

literatura

La incapacidad de adaptarse a los cambios del entorno del sector económico es la principal causa del fracaso en empresas.

(Romero Espinosa et al., 2015) Colombia Cuantitativo financiero

Análisis financiero y de flujos económicos

La mayoría de las empresas de Colombia que se encuentran sanas está en la ciudad de Bogotá, mientras que la mayor probabilidad de cierre se encuentra en empresas con menos de 5 años de constitución.

(Ropega, 2011) Estados Unidos Cualitativo /

Teórico Análisis cualitativo

Las habilidades de gerencia y el capital invertido son los factores más representativos.

(Santana, 2017) Colombia Cuantitativo económico

Función de Kaplan-Meier,

Duración de Weibull

La tasa de supervivencia en las empresas bogotanas decrece durante los primeros 6 años y se estabiliza desde allí en un 52%.

(Sharma & Mahajan, 1980) India Cuantitativo estadístico

Análisis discriminante múltiple

La razón financiera de retorno sobre los activos es la que tiene mayor impacto en la probabilidad de fracasar.

(Yip, 2006) Australia Cuantitativo Regresión logística La rentabilidad de la organización es el principal factor para determinar su éxito o fracaso.

Fuente: Elaboración propia a partir de fuentes diversas

25

Adicionalmente, en la Tabla 8 se muestra una tabla de recurrencia donde se identifican las variables que se han usado en los distintos modelos, de esta forma es más simple ver cuales se repiten y en qué tipo de estudios.

Tabla 8. Recurrencia de variables en la literatura

TIPO VARIABLE ESTUDIOS

CUANTITATIVOS ESTUDIOS

CUALITATIVOS TOTAL

Financiera - Flujo de Efectivo

Efectivo sobre las ventas 9 3 12

Efectivo sobre total activos 9 2 11

Efectivo sobre patrimonio total 7 2 9

Efectivo sobre pasivo total 6 1 7

Financiera - Rentabilidad

Utilidad Neta sobre las ventas 9 1 10

Utilidad Neta sobre total activos 9 1 10

Utilidad Neta sobre patrimonio total 6 2 8

Utilidad Neta sobre pasivo total 6 2 8

Financiera - Endeudamie

nto

Pasivo corriente sobre activo total 6 1 7

Obligaciones LP. sobre Activo Total 9 2 11

Pas. Total sobre Activo Total 9 2 11

Financiera - Liquidez

Activo corriente sobre Total Activo 7 2 9

Efectivo sobre pasivo corriente 6 2 8

Razón corriente 7 2 9

Financiera – Rotación

Cuentas por cobrar sobre las ventas 8 3 11

Inventarios sobre las ventas 6 2 8

Activos corrientes sobre las ventas 7 2 9

Capital de trabajo sobre las ventas 7 2 9

Patrimonio sobre las ventas 6 2 8

Total activos sobre las ventas 8 3 11

Financiera - Altman

Capital de Trabajo sobre Activos 9 4 13

Resultado del ejercicio sobre total activo 12 4 16

EBIT sobre activo corriente 8 3 11

Valor del patrimonio sobre total pasivos 8 3 11

Ventas sobre activos 11 4 15

Ubicación Localidad 2 5 7

Tamaño Tipo de empresa 5 7 12

Estructura

Razón social 0 1 1

Innovación 1 2 3

Exportador / Importador 0 1 1

Fuente: Elaboración propia

26

5. METODOLOGÍA GENERAL A partir de las características del problema introducidas en el Capítulo 1 y la revisión de bibliografía del Capítulo 4, se observa que el fenómeno de fracaso empresarial, es un problema que afecta a empresas de diversos tamaños e ingresos. Las decisiones estratégicas asociadas a la supervivencia son de gran importancia para los empresarios, así como conocer los factores asociados a esta. Según (Castillo, 2017), es posible realizar análisis de diferentes atributos y factores de problemas que comportan incertidumbre, tales como el descrito en este trabajo de tesis, a partir de metodologías de Análisis de Decisiones. Se empleará la metodología general mostrada en la Figura 11, para efectuar el diagnóstico y caracterización de los factores asociados a la supervivencia empresarial.

Figura 11. Metodología de solución de problemas con enfoque de Análisis de Decisiones

Fuente: (Castillo, 2017)

A continuación, se expondrá brevemente en qué consiste cada uno de los pasos de la metodología:

Descripción de la situación En esta etapa se busca sintetizar el contexto del problema, así como exponer sus principales componentes y consideraciones más importantes, se mencionan algunas variables relevantes para su análisis; en esta etapa se muestra la relevancia de darle solución al problema.

Estructuración formal del problema La segunda etapa de la metodología general se encarga de la descripción del sistema, así como los aspectos más importantes que lo componen, los cuales deben ser definidos claramente. Se identifican los actores o agentes que forman parte del problema, las fuentes de incertidumbre y se plantean las principales restricciones. A partir de la descripción de los componentes del problema y de los actores involucrados, se realiza una lista inicial de variables relevantes y se lleva a cabo la identificación inicial de modelos y herramientas que pueden ser útiles para la solución del problema.

27

Obtención de la información

En este paso, a partir de las variables, componentes, actores y demás elementos previamente identificados, se deben recolectar datos e información necesarios para analizar el problema. Frecuentemente la información proviene de fuentes primarias y secundarias tales como los juicios de expertos, encuestas, entrevistas y datos históricos.

Formulación de la metodología específica y de los modelos Esta etapa se diseña una metodología particular y puntal que busca adaptarse a las condiciones y características específicas de la situación problemática. También incluye la estructuración conceptual del modelo de representación con el que se busca dar solución al problema.

Aplicación de la metodología específica En esta fase, se desarrolla cada uno de los pasos establecidos en la metodología específica formulada anteriormente. Es aquí donde se construyen de forma detallada los modelos, se valida la lógica e inclusión de las variables más importantes y se analizan los resultados de la aplicación.

Conclusiones y Recomendaciones En el final de la metodología general, a partir de los resultados obtenidos y el análisis realizado se hacen conclusiones y recomendaciones.

28

6. DIAGNÓSTICO GENERAL DEL PROBLEMA En este capítulo se realiza un diagnóstico del fenómeno de fracaso empresarial en PYMES, describiendo la situación actual de estas en Colombia; se hará énfasis tanto en la ciudad objeto de estudio Bogotá, como en el sector económico de manufactura. 6.1. Situación general de las PYMES en Colombia Según cifras del Registro Único Empresarial y Social (RUES) y las Cámaras de Comercio, para el año 2011 existían 1’197.573 empresas conformadas principalmente por personas naturales (76.5%); este valor registró un incremento del 15.7% para el 2015, indicando un crecimiento en el emprendimiento. Sin embargo, en contraste a este crecimiento se ha evidenciado en el país que por cada 100 empresas constituidas formalmente, 23 nuevas ingresan al mercado, pero 19 son canceladas (Cámara de Comercio de Bogotá, 2009); lo cual representa un valor neto de 4 organizaciones, y una proporción de fracaso de alrededor del 70%. Las PYMES constituyen el 96.4% del total de empresas a nivel nacional y aportan el 80% del total de empleos del país (Mora E. & González Bravo, 2009; Romero Espinosa et al., 2015). En el reporte del Global Entrepreneurship Monitor Colombia (GEM) de 2017-2018 se estableció que las principales motivos para la discontinuidad empresarial están asociados a la no rentabilidad de la organización (35.6%), problemas financieros (16.1%) y venta del negocio (11.6%), como se muestra en la Figura 12 (Gómez-Núñez et al., 2018).

Figura 12. Razones para la discontinuidad empresarial en Colombia

Fuente: Adaptado de GEM 2017 (Gómez-Núñez et al., 2018)

6.2. PYMES y fracaso empresarial en Bogotá En Bogotá se encuentra la base empresarial más grande del país, cuyas principales actividades se enfocan en la comercialización de servicios, industria manufacturera y de construcción; así mismo, es también la ciudad donde mayor cierre empresarial ocurre. En el periodo 2006-2008 alrededor de

El negocio no es rentable

35%

Razones Personales

18%

Problemas financieros

16%

Oportunidad de vender el negocio

12%

Deserción planeada

9%

Otras no especificadas

10%

29

16 mil empresas fracasaron en promedio cada año. La proporción de ésta ocurrencia según tamaño de la organización se muestra en la Tabla 9.

Tabla 9. Distribución de empresas fracasadas y activos en Bogotá

TAMAÑO PORCENTAJE PROPORCIÓN DE ACTIVOS

Micro 96,0% 1,20%

Pyme 3,80% 10,6%

Grande 0,30% 88,2%

Fuente: Cámara de Comercio de Bogotá

La Tabla 10 muestra la distribución demográfica de los habitantes y la cantidad de empresas por localidad para el año 2017. En este periodo la localidad de Suba tuvo el mayor porcentaje del parque empresarial de la ciudad de Bogotá con el 12,73% del total de unidades productivas y una relación de 13,6 personas por empresa.

Tabla 10. Distribución de habitantes y cantidad de empresas por localidad en Bogotá

NÚMERO LOCALIDAD

LOCALIDAD POBLACIÓN CANTIDAD DE

EMPRESAS RELACIÓN

POBLACION/EMPRESAS

11 Suba 1.280.642 94.025 13,6

1 Usaquén 468.062 77.824 6,0

8 Kennedy 1.208.984 77.329 15,6

2 Chapinero 123.876 73.829 1,7

10 Engativá 878.430 71.895 12,2

16 Puente Aranda 221.905 38.315 5,8

12 Barrios Unidos 267.103 38.309 7,0

9 Fontibón 413.731 37.032 11,2

13 Teusaquillo 140.463 33.255 4,2

7 Bosa 731.041 30.380 24,1

14 Los Mártires 93.716 29.339 3,2

3 Santa Fe 89.447 29.033 3,1

19 Ciudad Bolívar 731.125 21.904 33,4

18 Rafael Uribe Uribe 350.946 21.883 16,0

4 San Cristóbal 387.736 16.561 23,4

15 Antonio Nariño 109.254 16.037 6,8

6 Tunjuelito 187.971 13.303 14,1

5 Usme 337.841 10.227 33,0

17 Candelaria 22.440 7.946 2,8

Fuente: (Observatorio de Desarrollo Económico, 2018)

La Figura 13 muestra esta relación de población por localidad de forma gráfica, mostrando que las localidades que se encuentran ubicadas al sur de la ciudad (Ciudad Bolívar, Bosa y Usme) tienen una mayor cantidad de personas por empresa constituida, mientras que las ubicadas en la zona central concentran la menor cantidad de personas por empresa. Esta distribución muestra además una preferencia de los emprendedores de crear empresas en las zonas del norte de la ciudad.

30

Figura 13. Mapa de Bogotá por localidades y demografía empresarial

Fuente: (Observatorio de Desarrollo Económico, 2018)

Tabla 11. Distribución de empresas bogotanas por tipo de sociedad

TIPO DE SOCIEDAD CANTIDAD PORCENTAJE

Persona natural 401.391 52,97%

Sociedad por acciones simplificada 199.223 26,29%

Sociedad limitada 110.901 14,63%

Empresas unipersonales 21.672 2,86%

Sociedad anónima 12.486 1,65%

Otras figuras jurídicas 12.109 1,60%

TOTAL 757.782 100,00%

Fuente: Cámara de Comercio de Bogotá

La mayoría de las empresas en la ciudad son comercios registrados a título personal (personas naturales) y las sociedades por acciones simplificadas, S.A.S, con una participación conjunta de más del 79% del total de organizaciones registradas ante la Cámara de Comercio durante el 2017. La preferencia de las sociedades por la figura S.A.S, está dada principalmente por los beneficios tributarios (Velásquez Pérez, 2003). De acuerdo al análisis efectuado por la Universidad Konrad Lorenz en el año 2014, se estableció que el área metropolitana de Bogotá es la que tiene la mayor cantidad de empresas sanas (no afectadas por fracaso empresarial) comparativamente con otras regiones del país como Antioquia, Valle del Cauca y la Costa Caribe (Romero Espinosa et al., 2015). El informe de causas de liquidación efectuado por la Cámara de Comercio de Bogotá, señala que la edad de la organización es un indicador de su capacidad de adaptación al mercado y su supervivencia, esta proporción se muestra en la Figura 14. Las principales causas asociadas a la liquidación de empresas PYME en Bogotá fueron financiamiento, normatividad legal y experiencia empresarial (Cámara de Comercio de Bogotá, 2009).

31

Figura 14. Fracaso empresarial por edades de empresas

Fuente: Cámara de Comercio de Bogotá

6.3. Fracaso empresarial en el sector manufactura El emprendimiento, entendido como la creación de nuevas empresas, es uno de los motores más importantes del desarrollo económico de un país (Lupiañez et al., 2014). Esto sustentado en los beneficios obtenibles como el aumento de puestos de trabajo y el dinamismo en los diversos sectores económicos. Con relación a la dinámica sectorial de las organizaciones empresariales del país, la aparición de nuevas empresas exhibe una tendencia decreciente para el sector manufactura, comparativamente con otros tales como consumo y servicios, tal como se ilustra en la Figura 15.

Figura 15. Ingreso al mercado de nuevas empresas según sector económico

Fuente: Adaptado de GEM 2017 (Gómez-Núñez et al., 2018)

54%

21%

25%

Menos de 3 años

Entre 4 y 7 años

Mayor de 8 años

0,00%

10,00%

20,00%

30,00%

40,00%

50,00%

60,00%

70,00%

80,00%

2013 2014 2015 2016 2017

PA

RT

ICIP

AC

IÓN

PO

RC

EN

TU

AL

AÑO

Consumo Servicios Industrial Manufacturero Extractivo

32

El sector manufactura aporto el 13.5% del PIB nacional en 2015, el cual ha venido en crecimiento desde el 2005, según las cifras del DANE; aun así, es el que muestra menor interés por la creación de nuevas empresas, asociada directamente por los analistas económicos al incremento en las tasas de impuestos (DANE, 2015). 6.4. Síntesis Colombia es un país en el que hay una mayor tasa de nacimiento de empresas nuevas comparativamente con las que son canceladas, aun así, la relación entre creación y fracaso es de alrededor del 70%. La región del país donde mayor proporción de empresas que han sobrevivido y fracasado se encuentra en la capital, Bogotá. Se ha establecido que la mayor proporción de las empresas existentes a nivel nacional son PYMES, cuyas principales causas de cierre están ligadas a factores internos y externos destacando la experiencia en el mercado y los resultados financieros. Analizar el fenómeno de fracaso empresarial de forma transversal entre sectores económicos, es decir, asumiendo que no hay relación entre el tipo de sector económico y la supervivencia de las empresas, resulta en estudios con menor capacidad de representar el problema comparado con aquellos que si integran este componente (Kosmidis & Stavropoulos, 2014b). Con respecto a los sectores de la economía, fue posible determinar que el marco colombiano, el sector de manufactura es el que se ve más afectado por la problemática de fracaso empresarial, fundamentalmente por el desinterés que muestra el mercado por crear nuevas organizaciones. Las Pymes se caracterizan por una frágil estructura patrimonial y financiera, que las limita al acceso a créditos tradicionales. Usualmente tienen prácticas gerenciales y organizacionales poco eficaces, producto de una inadecuada preparación de sus directivas y a una disponibilidad limitada de información para la toma de decisiones. Además, el margen de rentabilidad resultante de sus operaciones no es suficiente para cubrir sus gastos. (Ramirez Echeverry & Vanegas Garavito, 2008)

33

7. ESTRUCTURACIÓN FORMAL DEL PROBLEMA 7.1. Descripción de la situación De acuerdo con lo mostrado en el Capítulo 1, el fenómeno de fracaso empresarial tiene un impacto negativo en el crecimiento económico de los diferentes sectores de la economía, particularmente en empresas pequeñas, conocidas en la literatura como PYMES. Se han propuesto diversas investigaciones para comprender esta problemática con el objetivo de reducirla, tal como se mostró en los Capítulos 3 y 4. Sin embargo, mientras algunas de estas investigaciones buscan predecir el fenómeno otras dedican su esfuerzo a explicarlo conceptualmente; esta divergencia ha derivado en conclusiones variadas sobre los factores que ocasionan el fenómeno, los cuáles son un insumo importante la toma de decisiones de las directivas. 7.2. Aspectos principales del problema

En esta sección se describen los aspectos más relevantes del problema de supervivencia de empresas PYME, estos son:

Social: hace referencia al impacto que tiene la pérdida de empleos por el cierre de empresas causado por el fracaso empresarial.

Estratégico: caracterizado por el desempeño de las PYMES desde su administración y gestión para el alcance de objetivos misionales. Relacionado con la habilidad de las directivas para evitar el fracaso.

Económico: se refiere al grupo de variables financieras que involucra el desarrollo de actividades de una empresa, que resumen la viabilidad económica y su liquidez. Dentro de este aspecto se encuentra el crecimiento sectorial y las proyecciones económicas.

Normativo/Legal: se enfoca en el compendio de regulaciones y políticas gubernamentales para el funcionamiento, creación y disolución de empresas PYME en la ciudad de Bogotá.

7.3. Actores involucrados

Empresas PYME de la ciudad de Bogotá: las organizaciones de esta clasificación que pertenecen al sector manufacturero, sobre las cuales se busca efectuar un análisis de factores de supervivencia empresarial basado en la disciplina de Análisis de Decisiones.

Stakeholders: son los integrantes actuales de la cadena de suministro (proveedores de materia prima e insumos, clientes y otras organizaciones) que influyen directamente en las actividades de transformación y creación de valor por parte de las empresas objeto de estudio.

Gobierno Nacional: es el conjunto de actores principalmente políticos y económicos que se encargan de regular el entorno operativo, comercial y normativo de las PYME en Colombia. Se destacan la Cámara de Comercio de Bogotá, la Superintendencia de Sociedades y las asociaciones gremiales (Confecámaras, ANDI, entre otros).

7.4. Identificación preliminar de variables A partir de la revisión de literatura efectuada en el Capítulo 4, se seleccionarán aquellas variables que hayan sido mencionadas por lo menos a cinco veces, entre estudios cualitativos y cuantitativos, esta información se mostró en la Tabla 8 del Capítulo 4. La mayoría de estas variables predictoras

34

son razones financieras que se obtienen a partir de la aplicación de una fórmula matemática sobre datos disponibles en el Balance General, el Estado de Resultados y el Estado de Flujos de Efectivo, las restantes son información corporativa disponible en el Registro Mercantil y el Registro Único Empresarial (RUES). En la Tabla 12 se muestra el resumen de variables candidatas.

Tabla 12. Variables predictoras candidatas

TIPO VARIABLE TOTAL VECES MENCIONADA EN ESTUDIOS

Respuesta Fracaso o supervivencia empresarial 18

Financiera - Flujo de Efectivo

Efectivo sobre las ventas 12

Efectivo sobre total activos 11

Efectivo sobre patrimonio total 9

Efectivo sobre pasivo total 7

Financiera - Rentabilidad

Utilidad Neta sobre las ventas 10

Utilidad Neta sobre total activos 10

Utilidad Neta sobre patrimonio total 8

Utilidad Neta sobre pasivo total 8

Financiera - Endeudamiento

Pasivo corriente sobre activo total 7

Obligaciones LP. sobre Activo Total 11

Pas. Total sobre Activo Total 11

Financiera - Liquidez

Activo corriente sobre Total Activo 9

Efectivo sobre pasivo corriente 8

Razón corriente 9

Financiera - Rotación

Cuentas por cobrar sobre las ventas 11

Inventarios sobre las ventas 8

Activos corrientes sobre las ventas 9

Capital de trabajo sobre las ventas 9

Patrimonio sobre las ventas 8

Total activos sobre las ventas 11

Financiera - Altman

Capital de Trabajo sobre Activos 13

Resultado del ejercicio sobre total activo 16

EBIT sobre activo corriente 11

Valor del patrimonio sobre total pasivos 11

Ventas sobre activos 15

Tamaño Tipo de empresa 12

7.5. Fuentes de riesgo e incertidumbre Teniendo en cuenta que la mayoría de las variables relevantes identificadas corresponden a razones financieras, la principal fuente de incertidumbre es el comportamiento de las variables socioeconómicas, tales como la inflación, indicador de crecimiento sectorial y coeficientes de empleabilidad, entre otras; dado que, aunque es posible estimar sus tendencias y valores esperados, son susceptibles a cambios por políticas, movimientos bursátiles y otros agentes que dificultan su control.

35

7.6. Criterios de evaluación Como criterios de evaluación se usarán las medidas de desempeño (Especificidad, Sensibilidad, AUC) para evaluar el poder predictivo de los modelos de clasificación y la relación de interpretabilidad mostradas en el Capítulo 3.

36

8. DISEÑO DE LA METODOLOGÍA ESPECÍFICA PARA LA CLASIFICACIÓN DE FRACASO EMPRESARIAL EN PYMES

En este capítulo se plantea una metodología específica para solucionar el problema de clasificación de fracaso empresarial en PYMES de la ciudad de Bogotá, inicialmente se mostrará de forma gráfica la secuencia de pasos que se han de seguir y después se describirá el propósito de cada uno de ellos. 8.1. Diseño

Figura 16. Metodología Específica para la clasificación de fracaso empresarial en PYMES

1. Adquisición de la información de las empresas PYME de Bogotá

2. Depuración de la información financiera

3. Construcción de base de datos y cálculo de razones financieras

4. Análisis estadístico básico y elección de variables relevantes

6. Construcción de modelos de clasificación de fracaso empresarial

7. Validación de modelos y comparación de medidas de desempeño

5. Preprocesamiento y elección de conjunto de entrenamiento y prueba

8. Análisis de resultados y descripción de factores de supervivencia

Fuente: Elaboración propia.

37

8.2. Descripción de la metodología específica

Adquisición de la información de empresas PYME en Bogotá La información de las variables predictoras candidatas descritas en el Capítulo 7, se debe solicitar a las entidades reguladoras, tales como la Cámara de Comercio de Bogotá, la Superintendencia de Sociedades. Así mismo, es posible obtener información gratuita a partir de las bases de datos empresariales disponibles para consulta de los estudiantes de la Universidad de los Andes, tales como EMIS University, Bloomberg Database, entre otras. El propósito de realizar esta adquisición es disponer de información real y verificada de los estados financieros, matriculas mercantiles y registros únicos empresariales, a partir de los cuales se pueda modelar el fenómeno de fracaso empresarial.

Depuración de la información financiera Una vez conseguida la información general de las características y variables financieras, se procede a depurar aquellas observaciones que son inconsistentes o que tienen faltantes. De esta manera se puede garantizar la integridad de los datos con los que se construirán los modelos de clasificación. Esta depuración es necesaria porque, a pesar de que la información ha sido presentada a entidades oficiales, el proceso de transcripción de los estados financieros de las organizaciones es manual, por ende, existe la posibilidad de que contenga errores.

Construcción de Base de Datos y cálculo de razones financieras A partir de la depuración de la información, se procede a construir la Base de Datos. En este paso, también se calculan las razones financieras que hacen parte de las variables predictoras. Esta Base de Datos, será la que se empleará para construir los modelos de clasificación de fracaso empresarial. Con el objetivo de agilizar el tiempo computacional de los cálculos, se hará uso conjunto del software estadístico R junto con MS-Excel.

Análisis estadístico básico y elección de variables relevantes En esta etapa se revisa la estructura de las variables predictivas mediante estadística descriptiva, tablas de ANOVA y análisis de correlación entre las variables. El objetivo es comprender claramente las características de los datos y validar si efectivamente las variables predictoras candidatas son útiles para el modelamiento del fenómeno de fracaso empresarial.

Pre-procesamiento y elección de conjunto de entrenamiento y prueba En la construcción de modelos de clasificación, es necesario separar en dos conjuntos los datos disponibles, obteniendo primero un subconjunto de entrenamiento con el que se lleva a cabo la calibración de los parámetros y un segundo subconjunto sobre el que se evalúan las medidas de desempeño. Este paso se conoce como pre procesamiento y busca permitir que todos los modelos que se construyan sean evaluados con las mismas observaciones, fortaleciendo este modo la solidez de las conclusiones.

Construcción de modelos de clasificación para fracaso empresarial Con la separación de la Base de Datos en subconjuntos, se procede entonces a probar distintas herramientas de clasificación para modelar el fenómeno de fracaso empresarial. Es en este paso, dónde se lleva a cabo la representación de la situación problemática a partir de los datos disponibles.

38

Como se mencionó en los Capítulos 3 y 4, se emplearán técnicas como regresión logística, análisis discriminante, máquinas de soporte vectorial, modelos aditivos generalizados, etc.

Validación de modelos y comparación de medidas de desempeño Una vez que se han calibrado los modelos se procede a validarlos con el subconjunto de prueba y se ponderan las medidas de desempeño. De esta manera es posible analizar la pertinencia de representar el fracaso empresarial mediante los distintos modelos y herramientas. En este paso debe realizarse un listado o ranking de las alternativas según los resultados obtenidos, con el propósito de seleccionar aquel modelo que permita cumplir de mejor manera el objetivo general del trabajo de investigación.

Análisis de resultados y descripción de factores de supervivencia Finalizando la metodología específica propuesta, se debe analizar los resultados obtenidos del modelo seleccionado, así como efectuar la descripción de los factores que los han llevado al fracaso empresarial.

39

9. APLICACIÓN DE LA METODOLOGÍA ESPECÍFICA En este Capítulo, se aplica la metodología específica diseñada anteriormente para dar solución al problema. 9.1. Adquisición de la información de las empresas PYME en Bogotá La información de las variables candidatas no se encontraba disponible de forma conjunta en una sola base de datos, bien sea privada o pública. Fue necesario identificar las fuentes de cada una de las variables candidatas. En la Tabla 13 se resume las fuentes de información específicas para cada variable predictora, así como el código con el que será denominada en adelante.

Tabla 13. Codificación y fuentes de información para las variables

CLASE VARIABLE TIPO CÓDIGO FUENTE

Financiera - Flujo de Efectivo

Flujo efectivo sobre las ventas Continua FE1 EMIS University

Flujo efectivo sobre total activos Continua FE2 EMIS University

Flujo efectivo sobre patrimonio total Continua FE3 EMIS University

Flujo efectivo sobre pasivo total Continua FE4 EMIS University

Financiera - Rentabilidad

Utilidad Neta sobre las ventas Continua RE1 Supersociedades

Utilidad Neta sobre total activos Continua RE2 Supersociedades

Utilidad Neta sobre patrimonio total Continua RE3 Supersociedades

Utilidad Neta sobre pasivo total Continua RE4 Supersociedades

Financiera - Endeudamiento

Pasivo corriente sobre activo total Continua DE1 Supersociedades

Obligaciones LP. sobre Activo Total Continua DE2 EMIS University

Pas. Total sobre Activo Total Continua DE3 Supersociedades

Financiera - Liquidez

Activo corriente sobre Total Activo Continua LQ1 Supersociedades

Efectivo sobre pasivo corriente Continua LQ2 Supersociedades

Razón corriente Continua LQ3 EMIS University

Efectivo sobre las ventas Continua LQ4 Supersociedades

Financiera - Rotación

Cuentas por cobrar sobre las ventas Continua ROT1 Cámara de Comercio

Inventarios sobre las ventas Continua ROT2 Cámara de Comercio

Activos corrientes sobre las ventas Continua ROT3 Cámara de Comercio

Capital de trabajo sobre las ventas Continua ROT4 Cámara de Comercio

Patrimonio sobre las ventas Continua ROT5 Cámara de Comercio

Total activos sobre las ventas Continua ROT6 Cámara de Comercio

Financiera - Altman

Capital de Trabajo sobre Activos Continua A1 Supersociedades

Resultado del ejercicio sobre total activo Continua A2 Supersociedades

EBIT sobre activo corriente Continua A3 Supersociedades

Valor del patrimonio sobre total pasivos Continua A4 Supersociedades

Ventas sobre activos Continua A5 Supersociedades

Ubicación Localidad Categórica (L1-L19) Cámara de Comercio

Tamaño Tipo de empresa Categórica TAM(1-3) Cámara de Comercio

Respuesta Fracaso (1) o Supervivencia (0) Dicotómica RESPUESTA Cámara de Comercio

40

La información de la Superintendencia de Sociedades es de consulta gratuita en su portal web y almacena la información financiera de todas las empresas obligadas a registrar sus estados financieros según las normas NIIF (Normas Internacionales de Información Financiera). Asimismo, EMIS University es un banco de datos accesible para los estudiantes de la Universidad de los Andes, con registros de variables financieras y macroeconómicas de empresas pertenecientes a países de economía emergente y en crecimiento. Por su parte la Cámara de Comercio de Bogotá (CCB) es una entidad privada, uno de sus servicios pagos es la consulta de información empresarial, de esta se obtuvo acceso a 2200 registros de empresas PYME bogotanas pertenecientes al sector manufacturero de los años 2016, 2017 y 2018. El soporte de adquisición se encuentra en el Anexo A. La información de los Estados Financieros (Pérdidas y Ganancias, Flujo de Efectivo, Balance General), Registro Mercantil y demás se cruzaron entre las tres fuentes de información mediante el NIT, el cual es el número de identificación de cada empresa. El resultado de este paso es un conjunto de datos que servirá para construir la Base de Datos con la que se llevarán a cabo los modelos de clasificación. En la Figura 17 se muestra un fragmento de los datos obtenidos.

Figura 17. Fragmento de información recopilada para la construcción de la Base de Datos

Fuente: Adaptado de (Cámara de Comercio de Bogotá,2019; Supersociedades,2019; Emis University,2019)

9.2. Depuración de la información obtenida

Una vez que se ha obtenido la información financiera y organizacional de las empresas, se procede a evaluar la estructura de los datos y detectar inconsistencias, tales como: valores faltantes y diferencias de valores entre estados financieros (ej. la ganancia reportada en el P&G no coincide con la del Balance General). Como resultado de este procedimiento se tiene que 108 empresas, no tienen reportado su localidad de operación dentro de la ciudad de Bogotá, y su dirección de entrega judicial está fuera del departamento. Además, 9 empresas registran erróneamente valores en sus estados financieros, un error asociado a la transcripción de los datos físicos al sistema de información de la Cámara de Comercio. Una vez concluida esta depuración se tiene una base de datos de 2083 empresas. 9.3. Construcción de la Base de Datos y cálculo de razones financieras

A partir de la información depurada, se procede a calcular las razones financieras que el presente trabajo de Tesis emplea como predictores. Estas razones financieras son métricas para cuantificar la realidad económica y financiera de una empresa, estas frecuentemente se clasifican según la característica que miden (liquidez, rotación, rentabilidad, etc.) (Ortiz Anaya, 1998). Las métricas (fórmulas) para calcularlas y sus descripciones se muestran en la Tabla 14.

41

Tabla 14. Métrica y descripción de razones financieras empleadas

CODIFICACIÓN FÓRMULA DESCRIPCIÓN

FE1 𝐹𝑙𝑢𝑗𝑜 𝑑𝑒 𝐸𝑓𝑒𝑐𝑡𝑖𝑣𝑜

𝑉𝑒𝑛𝑡𝑎𝑠

Es una métrica que permite identificar qué proporción del flujo de efectivo se debe a las ventas, activos, patrimonio o deudas que tiene la organización. Son indicadores de solvencia, y representan la capacidad de la empresa para responder económicamente en el corto plazo.

FE2 𝐹𝑙𝑢𝑗𝑜 𝑑𝑒 𝐸𝑓𝑒𝑐𝑡𝑖𝑣𝑜

𝑇𝑜𝑡𝑎𝑙 𝐴𝑐𝑡𝑖𝑣𝑜

FE3 𝐹𝑙𝑢𝑗𝑜 𝑑𝑒 𝐸𝑓𝑒𝑐𝑡𝑖𝑣𝑜

𝑃𝑎𝑡𝑟𝑖𝑚𝑜𝑛𝑖𝑜 𝑇𝑜𝑡𝑎𝑙

FE4 𝐹𝑙𝑢𝑗𝑜 𝑑𝑒 𝐸𝑓𝑒𝑐𝑡𝑖𝑣𝑜

𝑃𝑎𝑠𝑖𝑣𝑜 𝑇𝑜𝑡𝑎𝑙

RE1 𝑈𝑡𝑖𝑙𝑖𝑑𝑎𝑑 𝑁𝑒𝑡𝑎

𝑉𝑒𝑛𝑡𝑎𝑠

Las razones financieras de rentabilidad tienen como objetivo evaluar las utilidades de una empresa frente a valores como las ventas, los activos, patrimonios y deudas. Estos indicadores muestran la capacidad de una empresa para producir ganancias.

RE2 𝑈𝑡𝑖𝑙𝑖𝑑𝑎𝑑 𝑁𝑒𝑡𝑎

𝑇𝑜𝑡𝑎𝑙 𝐴𝑐𝑡𝑖𝑣𝑜𝑠

RE3 𝑈𝑡𝑖𝑙𝑖𝑑𝑎𝑑 𝑁𝑒𝑡𝑎

𝑃𝑎𝑡𝑟𝑖𝑚𝑜𝑛𝑖𝑜 𝑇𝑜𝑡𝑎𝑙

RE4 𝑈𝑡𝑖𝑙𝑖𝑑𝑎𝑑 𝑁𝑒𝑡𝑎

𝑃𝑎𝑠𝑖𝑣𝑜 𝑇𝑜𝑡𝑎𝑙

DE1 𝑃𝑎𝑠𝑖𝑣𝑜 𝐶𝑜𝑟𝑟𝑖𝑒𝑛𝑡𝑒

𝐴𝑐𝑡𝑖𝑣𝑜 𝑇𝑜𝑡𝑎𝑙

Las razones de endeudamiento o apalancamiento financiero, son métricas para evaluar la capacidad de pago que tienen las empresas, así mismo, también miden el grado de endeudamiento existente en la organización.

DE2 𝑂𝑏𝑙𝑖𝑔𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑎 𝐿𝑎𝑟𝑔𝑜 𝑃𝑙𝑎𝑧𝑜

𝐴𝑐𝑡𝑖𝑣𝑜 𝑇𝑜𝑡𝑎𝑙

DE3 𝑃𝑎𝑠𝑖𝑣𝑜 𝑇𝑜𝑡𝑎𝑙

𝐴𝑐𝑡𝑖𝑣𝑜 𝑇𝑜𝑡𝑎𝑙

LQ1 𝐴𝑐𝑡𝑖𝑣𝑜 𝐶𝑜𝑟𝑟𝑖𝑒𝑛𝑡𝑒

𝑇𝑜𝑡𝑎𝑙 𝐴𝑐𝑡𝑖𝑣𝑜

Las razones de liquidez, se caracterizan por ser métricas para evaluar la habilidad de una empresa para producir y mantener efectivo a corto plazo. Buscan mostrar que proporción del ingreso o activo permanece dentro de la empresa al finalizar el ejercicio.

LQ2 𝐸𝑓𝑒𝑐𝑡𝑖𝑣𝑜

𝑃𝑎𝑠𝑖𝑣𝑜 𝐶𝑜𝑟𝑟𝑖𝑒𝑛𝑡𝑒

LQ3 𝐴𝑐𝑡𝑖𝑣𝑜 𝐶𝑜𝑟𝑟𝑖𝑒𝑛𝑡𝑒

𝑃𝑎𝑠𝑖𝑣𝑜 𝐶𝑜𝑟𝑟𝑖𝑒𝑛𝑡𝑒

LQ4 𝐸𝑓𝑒𝑐𝑡𝑖𝑣𝑜

𝑉𝑒𝑛𝑡𝑎𝑠

ROT1 𝐶𝑢𝑒𝑛𝑡𝑎𝑠 𝑝𝑜𝑟 𝑐𝑜𝑏𝑟𝑎𝑟

𝑉𝑒𝑛𝑡𝑎𝑠

Las razones de rotación, miden el esfuerzo que tiene que realizar la empresa para convertir en efectivo las cuentas por cobrar, inventarios y activos circulantes. Estas métricas también son conocidas como razones de actividad y como su nombre indica, evalúan si la empresa se encuentra estancada financieramente o no.

ROT2 𝐼𝑛𝑣𝑒𝑛𝑡𝑎𝑟𝑖𝑜𝑠

𝑉𝑒𝑛𝑡𝑎𝑠

ROT3 𝐴𝑐𝑡𝑖𝑣𝑜𝑠 𝐶𝑜𝑟𝑟𝑖𝑒𝑛𝑡𝑒𝑠

𝑉𝑒𝑛𝑡𝑎𝑠

ROT4 𝐶𝑎𝑝𝑖𝑡𝑎𝑙 𝑑𝑒 𝑇𝑟𝑎𝑏𝑎𝑗𝑜

𝑉𝑒𝑛𝑡𝑎𝑠

ROT5 𝑃𝑎𝑡𝑟𝑖𝑚𝑜𝑛𝑖𝑜

𝑉𝑒𝑛𝑡𝑎𝑠

ROT6 𝑇𝑜𝑡𝑎𝑙 𝐴𝑐𝑡𝑖𝑣𝑜𝑠

𝑉𝑒𝑛𝑡𝑎𝑠

A1 𝐶𝑎𝑝𝑖𝑡𝑎𝑙 𝑑𝑒 𝑇𝑟𝑎𝑏𝑎𝑗𝑜

𝐴𝑐𝑡𝑖𝑣𝑜𝑠

Este indicador muestra la proporción de dinero libre de deuda en relación con los activos de la empresa. Es el indicador de liquidez que emplea el Z-Score.

A2 𝑅𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜 𝑑𝑒𝑙 𝑒𝑗𝑒𝑟𝑐𝑖𝑐𝑖𝑜

𝑇𝑜𝑡𝑎𝑙 𝐴𝑐𝑡𝑖𝑣𝑜

Este es el indicador de rentabilidad empleado por Altman en su modelo discriminante.

A3 𝐸𝐵𝐼𝑇

𝐴𝑐𝑡𝑖𝑣𝑜 𝐶𝑜𝑟𝑟𝑖𝑒𝑛𝑡𝑒

Mide la eficiencia operacional fuera de impuestos y amortizaciones. Esta razón financiera reconoce la importancia de la utilidad operacional en la supervivencia a largo plazo de la compañía.

A4 𝑉𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑃𝑎𝑡𝑟𝑖𝑚𝑜𝑛𝑖𝑜

𝑃𝑎𝑠𝑖𝑣𝑜 𝑇𝑜𝑡𝑎𝑙

Este indicador de variabilidad respecto al mercado bursátil, muestra el valor del patrimonio comparado con el pasivo de la organización. Representa la proporción de las deudas que se cubre con el valor real de la empresa en el mercado.

A5 𝑉𝑒𝑛𝑡𝑎𝑠

𝑇𝑜𝑡𝑎𝑙 𝐴𝑐𝑡𝑖𝑣𝑜𝑠

Esta razón mide la rotación de activos en función de las ventas.

42

Fuente: Adaptado de (Caro, Guardiola, & Ortiz, 2018; Ortiz Anaya, 1998)

Aplicando las fórmulas a los datos adquiridos y depurados en la segunda etapa de la metodología específica, se logra un consolidado de 2083 registros de empresas con 29 variables, de las cuales 28 son predictores y 1 respuesta con dos factores. La Figura 18 muestra un fragmento de la Base de Datos que se elaboró para el presente trabajo.

Figura 18. Fragmento de la Base de Datos Construida

Fuente: Elaboración propia con datos de fuentes diversas

9.4. Análisis estadístico básico Con ayuda del Software de programación estadístico R, el cuál es de uso libre e instalación gratuita, se precederá a realizar un análisis exploratorio de las variables de la Base de Datos, con el propósito de conocer las características de cada una de ellas. 9.4.1. Proporción por categorías de variable de respuesta En primera instancia se evalúa el balance existente entre las dos categorías de la variable de respuesta, encontrando que, de las 2083 empresas, 1962 pertenecen a la categoría de “supervivencia”, mientras que 121 son empresas que han fracasado. La Figura 19 muestra la cantidad de empresas en cada clase, donde el balance es de 94.2% de empresas que sobrevivieron contra 5.8% de empresas que fracasan.

43

Figura 19. Diagrama de barras de cantidades de empresas según categoría

Fuente: Elaboración propia

9.4.2. Análisis de variables continuas (razones financieras) Las principales medidas de tendencia central y desviación estándar se muestran en la Tabla 15. De esta tabla se puede ver que los rangos (𝑉𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 − 𝑉𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜) son bastante amplios entre las distintas variables, y con desviaciones estándar bastante grandes, lo anterior debido principalmente a la diversidad de actividades económicas y características internas de cada empresa.

Tabla 15. Estadísticas descriptivas y medidas de tendencia central

VARIABLE MEDIA MEDIANA DESV. EST. MÍNIMO MÁXIMO

FE1 1582384,009 0,000249629 171203083,8 -3735874175 5000155503

FE2 -0,001768176 0,000379531 0,080058642 -0,754133115 0,517741643

FE3 1628715,751 0,001369112 327582095,2 -4092820266 9478651284

FE4 -13739360,43 0,000680939 266609535,1 -5197277803 2045158639

RE1 -8564985,313 0,024834963 196041168,1 -5941279765 2303897181

RE2 -8700093,694 0,036868215 205153195,8 -7887805909 0,580474053

RE3 -4150109,756 0,099102566 436787346,5 -8413175505 8081532453

RE4 10249652,57 0,069035769 274415325,9 -4842752242 4848906789

DE1 17058717,13 0,462443208 225156393,6 7,72E-06 7528781025

DE2 6574797,143 0 112470336,9 0 3060624789

DE3 29159758,88 0,57201845 276854994,5 7,72E-06 7528781025

LQ1 0,075702332 0,041255619 0,098096458 0 0,855361846

LQ2 0,7892148 0,852098596 0,205601169 0,005658545 1

LQ3 113779016,8 0,098710637 614008863,1 0 9452177568

LQ4 1023011122 264326819 1397510907 0,000169611 9974553242

ROT1 90396041,27 0,244335609 570697349,3 0 7801383195

ROT2 69663325,96 0,162669755 512274071,6 0 7964599248

ROT3 249345965 0,508846551 823204519,6 0,005228198 8350765325

ROT4 68211556,88 0,201361516 562391796,8 -6425613599 8358415644

ROT5 143081440,3 0,273624238 799882965,5 -8246236305 9338851696

ROT6 442638532 0,647606786 1080626580 0,010132957 9567989103

A1 -7651909,512 0,318437575 169046334,7 -6654822858 0,990207739

44

VARIABLE MEDIA MEDIANA DESV. EST. MÍNIMO MÁXIMO

A2 516847,3675 0,110952411 23588852,4 0 1076592743

A3 -8695418,994 0,061071534 205118592,2 -7887805909 0,874323862

A4 824472342,6 0,748195359 1472668650 -0,867176373 9938056623

A5 1527602649 1438423216 1489500468 0,000696418 9928422364

Fuente: Elaboración propia

Boxplot e histogramas para razones de flujo de efectivo La Figura 20 contiene los diagramas de caja o “boxplots” de las razones de flujo de efectivo (FE1 – FE4) en contraste con la variable de respuesta. De los cuales, no se observa diferencia entre las medianas para ninguna de las observaciones, pero sí varios datos fuera del espacio de la caja. Estas observaciones, que pueden ser consideradas atípicas, no deberían removerse, puesto que promueven que los modelos integren la dispersión inherente al fenómeno de fracaso empresarial (Caro et al., 2018; Valencia, 2018)

Figura 20. Diagramas de caja para razones de flujo de efectivo

Fuente: Elaboración propia

Los histogramas de la Figura 21, muestran que las variables FE1, FE3 y FE4 se concentran alrededor de valore específicos y sin mayor variabilidad apreciable. Es la variable FE2 la que muestra un comportamiento más aleatorio con una distribución de datos concentrados alrededor de cero.

45

Figura 21. Histogramas de razones de flujo de efectivo

Fuente: Elaboración propia

Boxplot e histogramas para razones de rentabilidad La Figura 22 muestra los diagramas de cajas para las variables RE1, RE2, RE3 y RE4. Se destaca que todas las variables tienen la concentración de valores alrededor de cero, para las dos categorías de la variable de respuesta, indicando de este modo que no visualmente no hay diferencia entre las medianas. Así mismo, la variable RE2 muestra varios datos aislados con valores negativos bastante alejados del cero. Por su parte, la Figura 23 muestra la distribución de los datos en histogramas de frecuencias para las variables independientemente del tipo de clasificación (Supervivencia = 0 y Fracaso =1), al igual que en el grupo de variables de flujo de efectivo, las gráficas muestran que los datos se concentran alrededor del valor cero.

46

Figura 22. Diagramas de caja para razones de rentabilidad

Fuente: Elaboración propia

Figura 23. Histogramas de razones de rentabilidad

Fuente: Elaboración propia

47

Boxplot para razones de endeudamiento Las variables asociadas a razones de endeudamiento muestran un comportamiento similar a los grupos anteriores, con valores alrededor de cero; aun así, se diferencian puesto que todas las observaciones aisladas toman valores positivos. Estos comportamientos se muestran en las Figuras 24 y 25.

Figura 24. Diagrama de cajas para razones de endeudamiento

Fuente: Elaboración propia

Figura 25. Histograma para razones de endeudamiento

Fuente: Elaboración propia

48

Boxplot e histogramas para razones de liquidez En la Figura 26 el boxplot de las razones de liquidez muestra que las variables ya no se encuentran distribuidas alrededor de cero, se observa diferencia entre las medianas por clasificación de variable de respuesta en LQ1, LQ2 y LQ4. La variable LQ3 no muestra una diferencia apreciable entre las medianas y se ve que la categoría de “Supervivencia” tiene más datos aislados comparativamente con la categoría de “Fracaso”.

Figura 26. Diagrama de cajas razones de liquidez

Fuente: Elaboración propia

La Figura 27 contiene los histogramas de las cuatro variables, donde se ve que las variables LQ1, LQ3 y LQ4 están sesgadas hacia la izquierda, con tendencia hacia el cero; mientras que la variable LQ2 tiene un comportamiento inverso, estando sesgada hacia la derecha, con valores concentrados cerca del 1.

49

Figura 27. Histograma razones de liquidez

Fuente: Elaboración propia

Razones de rotación o actividad Las razones de rotación que agrupan las variables ROT1 – ROT6, no muestran diferencias apreciables entre las medianas, tal como muestra la Figura 28. La variable ROT6 tiene muchos menos valores aislados para la categoría “Fracaso” en comparación con la categoría “Supervivencia”. En la Figura 29, se ve que las variables de rotación tienen valores alrededor de cero y se encuentran sesgadas hacia la izquierda, y toman solamente valores mayores o iguales a cero, a excepción de ROT5 y ROT6; estas últimas dos variables tienen observaciones que toman valores tanto negativos como positivos.

50

Figura 28. Diagrama de cajas razones de rotación

Fuente: Elaboración propia

Figura 29. Histogramas razones de rotación

51

Razones Z-Score Las razones de Altman tienen métricas de distinto tipo (liquidez, rotación, endeudamiento, etc.), razón por la cual entre ellas los diagramas de cajas mostradas en la Figura 30, no tienen muchas características comunes. En particular la variable A4 asociada al valor real de la organización deja ver que hay variabilidad entre las empresas que se clasifican como fracasadas y aquellas que han sobrevivido.

Figura 30. Diagrama de cajas razones del Altman Z-Score

Fuente: Elaboración propia

Por su parte en los histogramas, mostrados en la Figura 31, se ve que las variables A1, A2 y A3 se distribuyen alrededor del valor cero con pocas observaciones aisladas; mientras que las variables A4 y A5 se encuentran sesgadas hacia la izquierda y tienen mayor variabilidad.

52

Figura 31. Histogramas de razones Altman Z-Score

Fuente: Elaboración propia

9.4.3. Análisis de variables categóricas (Tamaño y Localidad) La información de la ubicación geográfica de las empresas manufactureras de Bogotá se representa mediante la variable Localidad, la cual se encuentra entre 1 y 19, para representar las localidades en las que se divide administrativamente la ciudad. Mediante el uso del Software R se transformó esta variable en un factor numérico para uso en los modelos, estos se resumen en la Tabla 16.

Tabla 16. Localidades de la ciudad de Bogotá

NÚMERO LOCALIDAD

LOCALIDAD

1 Usaquén

2 Chapinero

3 Santa Fe

4 San Cristóbal

5 Usme

6 Tunjuelito

7 Bosa

8 Kennedy

9 Fontibón

10 Engativá

11 Suba

12 Barrios Unidos

13 Teusaquillo

53

NÚMERO LOCALIDAD

LOCALIDAD

14 Los Mártires

15 Antonio Nariño

16 Puente Aranda

17 Candelaria

18 Rafael Uribe

19 Ciudad Bolívar

Fuente: (Observatorio de Desarrollo Económico, 2018) En la Figura 32 se muestra la cantidad de empresas por localidad según la variable de respuesta, donde se ve que la mayor cantidad de empresas que han sobrevivido se encuentra en la localidad 1 (Usaquén) mientras que las localidades 5 y 16 (Usme y Puente Aranda) tienen la mayor cantidad de empresas fracasadas.

Figura 32. Diagrama de barras variable categórica Localidad

Fuente: Elaboración propia

La variable categórica Tamaño, también fue transformada en factor numérico para cada uno de sus tres niveles (Mediana =1, Micro = 2 y Pequeña =3), donde se ve que las empresas medianas tienen la mayor cantidad de empresas para las dos clases de la variable de respuesta. Esta proporción se muestra la Figura 33.

54

Figura 33. Diagrama de barras para la variable tamaño

Fuente: Elaboración propia

9.4.4. Análisis de correlación y ANOVA En esta sección se elabora un correlograma de las variables, principalmente para identificar las relaciones entre ellas, este se muestra en la Figura 34.

Figura 34. Correlograma para las variables del estudio

55

Del gráfico de correlaciones anterior, se puede ver que ninguna variable predictora tiene una correlación positiva o negativa mayor que 0.3 con respecto a la variable de respuesta. Sin embargo, existen relaciones entre variables que tienen correlaciones altas ( 𝜌 > 0.7 ó 𝜌 < −0.7) como por ejemplo A3 y RE1 o A1 y DE1. Estas relaciones de dependencia entre variables ocurren dado que los rubros empleados para calcular las razones financieras son los mismos o muy similares y ocurren principalmente.

La Tabla 17 contiene la ANOVA de las predictoras en función de la respuesta. Esta realiza una generalización de pruebas de comparación de medias, indicando a distintos niveles de confianza, si una variable es estadísticamente significativa.

Tabla 17. Tabla de ANOVA para las variables del estudio

VARIABLE DF SUM SQ MEAN SQ F VALUE Pr(>F) SIGNIFICANCIA

LOCALIDAD 17 18,52 1,0896 30,362 < 2e-16 ***

TAMAÑO 2 5,70 2,8482 79,369 < 2e-16 ***

FE1 1 0,00 0,0007 0,02 0,887602

FE2 1 0,05 0,0535 1,492 0,222103

FE3 1 0,30 0,2986 8,322 0,003958 **

FE4 1 0,14 0,1387 3,865 0,049441 *

RE1 1 0,88 0,8777 24,458 8,22E-07 ***

RE2 1 2,30 2,2994 64,074 1,99E-15 ***

RE3 1 0,04 0,0383 1,069 0,301404

RE4 1 0,58 0,5824 16,23 5,82E-05 ***

DE1 1 2,76 2,7602 76,916 < 2e-16 ***

DE2 1 2,42 2,4178 67,373 3,94E-16 ***

DE3 1 0,74 0,7426 20,693 5,71E-06 ***

LQ1 1 0,38 0,3776 10,522 1,20E-03 **

LQ2 1 0,79 0,7857 21,896 3,07E-06 ***

LQ3 1 0,43 0,4251 11,847 0,000589 ***

LQ4 1 0,00 0,0005 0,013 0,907922

ROT1 1 1,37 1,3674 38,104 8,07E-10 ***

ROT2 1 0,45 0,4548 12,673 0,003790 ***

ROT3 1 0,84 0,8391 23,383 1,43E-06 ***

ROT4 1 0,17 0,1672 4,66 0,030994 *

ROT5 1 0,47 0,4736 13,197 0,000287 ***

ROT6 1 0,69 0,6908 19,25 1,21E-05 ***

A1 1 0,27 0,2688 7,491 0,006255 **

A2 1 0,04 0,0375 1,046 0,306502

A3 1 0,35 0,3468 9,665 0,001904 **

A4 1 0,20 0,2032 5,661 0,017435 *

A5 1 0,00 0,0035 0,098 0,754558

Residuos 2037 73,10 0,0359

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Fuente: Elaboración propia

56

De la tabla de ANOVA, se puede concluir que las variables FE1, FE2, RE3, LQ4, A2 y A5 no son significativas, es decir, no hay evidencia estadística suficiente para concluir que existen diferencias entre los niveles de estas variables en función de la respuesta “Supervivencia” y “Fracaso”. También es relevante mencionar que las variables categóricas de Tamaño y Localidad son significativas.

9.5. Pre-procesamiento de datos y elección del conjunto de entrenamiento y prueba En esta sección se realizan la construcción de variables binarias o “dummy” que representarán los niveles de las variables categórica “Tamaño” y “Localidad”. Adicionalmente, se separan los conjuntos de entrenamiento y prueba; el conjunto de entrenamiento se utiliza para calibrar los parámetros del modelo y el conjunto de prueba se utiliza para evaluar el desempeño predictivo y explicativo de los modelos (Valencia, 2018). La separación de las muestras se realizará con 80% de los registros de la Base de Datos para el conjunto de entrenamiento y el 20% restante será el conjunto de prueba. La Tabla 18 muestra la cantidad de empresas por conjunto y la Figura 35 la comparación según la variable de respuesta.

Tabla 18. Cantidad de empresas por conjunto

CONJUNTO SUPERVIVENCIA FRACASO

Entrenamiento 1569 97

Prueba 393 24

Fuente: Elaboración propia

Figura 35. Diagrama de barras según conjunto de muestras

Fuente: Elaboración propia

57

9.6. Construcción de modelos de clasificación para fracaso empresarial

Esta sección comprende la elaboración de los modelos de clasificación de empresas bogotanas del sector de manufactura que sean susceptibles a fracasar. La construcción de estos modelos se realizó con ayuda del Software R, a continuación, se muestran los modelos construidos. 9.6.1. Regresión logística “Stepwise BIC” La regresión logística simple se construyó mediante el paquete (glm) del software estadístico R, como se mencionó en el marco teórico este modelo de clasificación busca modelar una probabilidad a partir de la ecuación:

𝑃(𝑌 = 𝑘|𝑋 = 𝑥) =1

1 + 𝑒−(𝛽0+𝛽1𝑋)

El modelamiento de estas probabilidades es el primer paso de la construcción del clasificador, después debe elegirse un margen o “threshold” que permitirá convertir las probabilidades en valores numéricos asociados a los factores “Supervivencia” y “Fracaso”, esto es matemáticamente:

1: ��(𝑌 = 1|𝑋) > 𝑇ℎ𝑟𝑒𝑠ℎ𝑜𝑙𝑑

0: ��(𝑌 = 1|𝑋) ≤ 𝑇ℎ𝑟𝑒𝑠ℎ𝑜𝑙𝑑}

Este margen se obtiene mediante el uso de optimización y validación cruzada, de tal manera que se maximice la precisión del modelo de regresión lineal sobre la muestra de entrenamiento. En la Figura 36 se muestra la variación del error de predicción según el margen asignado. Se obtiene que el “threshold” que mejora la capacidad predictiva de la regresión es 0.05; esto significa que toda predicción que tenga un valor superior a 0.05 será clasificada como “Fracaso”.

Figura 36. Gráfico de “Threshold” vs poder predictivo

Fuente: Elaboración propia

58

Una metodología para determinar las variables más representativas en un modelo de regresión logística es la “Stepwise BIC”, cuyo objetivo es eliminar sistemáticamente variables predictoras de

acuerdo a un criterio de evaluación de modelos, que puede ser en caso de regresión el 𝑅2 y en clasificación el AIC o el BIC. El AIC y el BIC son medidas de error predictivo, y a medida que su valor disminuye se dice que el modelo es mejor. En “Stepwise BIC” se puede emplear una selección de variables hacia adelante, una aproximación conocida como “forward”, agregando en cada iteración una variable predictora y evaluando la métrica BIC; también, es posible seleccionar por eliminación de variables, conocida como “backward”, iniciando con un modelo que contenga todos los predictores e ir eliminando en cada iteración de la regresión logística una variable predictora. En la actualidad es frecuente utilizar una combinación de los métodos anteriores. La ecuación de la regresión logística obtenida es:

𝐿𝑜𝑔 𝑂𝑑𝑑𝑠 = −2,645 + 2.688𝑒−9(𝐷𝐸3) + 2,741(𝑇𝐴𝑀. 𝑃𝑒𝑞𝑢𝑒ñ𝑎) + 3,241𝑒−10(𝑅𝑂𝑇6)+ 2,687(𝐿𝑜𝑐𝑎𝑙𝑖𝑑𝑎𝑑 5) − 1,618(𝐿𝑜𝑐𝑎𝑙𝑖𝑑𝑎𝑑11) + 1,348(𝐿𝑜𝑐𝑎𝑙𝑖𝑑𝑎𝑑16)+ 2,714(𝐿𝑜𝑐𝑎𝑙𝑖𝑑𝑎𝑑17) − 5,801(𝐿𝑄1) − 4.089−10(𝐴5)

𝑃𝑅𝐿𝑜𝑔(𝑌 = 1) =1

1 + 𝑒−(𝐿𝑜𝑔 𝑂𝑑𝑑𝑠)

9.6.2. LASSO El método de penalización LASSO desarrollado por (Tibshirani, 1996) tiene como parámetro principal el factor 𝜆, que debe ser estimado mediante validación cruzada. La obtención de este parámetro depende en gran medida de la métrica con la que se quiera evaluar el desempeño predictivo del modelo respecto a los datos de entrenamiento, en este caso se selecciona el área bajo la curva ROC. En la Figura 37 se muestra que el valor de 𝜆 que maximiza el AUC sobre los datos de

entrenamiento es 𝜆 = 0.02112284.

Figura 37. Estimación de lambda LASSO mediante validación cruzada y AUC

Fuente: Elaboración propia

59

Una vez conocido este parámetro se procede a calibrar el modelo de regresión logística con penalización LASSO, con ayuda del paquete (glmnet) del Software R.

𝐿𝑜𝑔 𝑂𝑑𝑑𝑠 𝐿𝐴𝑆𝑆𝑂= −3,2908 + 1.0444𝑒−9(𝐷𝐸3) + 1,4017(𝑇𝐴𝑀. 𝑃𝑒𝑞𝑢𝑒ñ𝑎) + 1,9749𝑒−10(𝑅𝑂𝑇6)+ 1,877(𝐿𝑜𝑐𝑎𝑙𝑖𝑑𝑎𝑑 5) + 1.991𝑒−1(𝐿𝑜𝑐𝑎𝑙𝑖𝑑𝑎𝑑16) + 1,727(𝐿𝑜𝑐𝑎𝑙𝑖𝑑𝑎𝑑17)

𝑃𝐿𝐴𝑆𝑆𝑂(𝑌 = 1) =1

1 + 𝑒−(𝐿𝑜𝑔 𝑂𝑑𝑑𝑠 𝐿𝐴𝑆𝑆𝑂)

9.6.3. RIDGE El modelo de penalización RIDGE obliga a que todos los coeficientes estimados de la regresión logística tomen un valor diferente de cero. Al igual que LASSO requiere del cálculo mediante validación cruzada del parámetro 𝜆. La Figura 38 muestra cómo se afecta el AUC en función de

lambda, y se determina que aquel que maximiza el área bajo la curva es 𝜆 = 0.2212862.

Figura 38. Estimación de lambda RIDGE mediante validación cruzada y AUC

Fuente: Elaboración propia

La calibración del modelo RIDGE se realiza mediante el paquete (glmnet). Los valores asociados a

los coeficientes (��𝑖) se encuentran en la columna RIDGE de la Tabla 19, la cual resume comparativamente los valores estimados de los distintos modelos de regresión logística empleados anteriormente.

Tabla 19. Coeficientes estimados de los modelos de regresión logística

VARIABLE REG. LOGÍSTICA LASSO RIDGE

(Intercept) -2,64E+06 -3,29E+06 -2,78E+06

LOCALIDAD2 -1,73E+06 0 -6,19E+02

LOCALIDAD3 -3,77E+05 0 9,18E+01

LOCALIDAD4 -5,07E+05 0 -3,73E+02

LOCALIDAD5 2,69E+06 1,88E+06 5,74E+03

60

VARIABLE REG. LOGÍSTICA LASSO RIDGE

LOCALIDAD6 -2,14E+05 0 1,54E+02

LOCALIDAD7 -8,85E+05 0 -6,43E+02

LOCALIDAD8 -1,64E+07 0 -9,12E+02

LOCALIDAD9 -7,05E+05 0 -3,35E+02

LOCALIDAD11 -1,62E+06 0 -6,92E+02

LOCALIDAD12 -7,89E+05 0 -5,20E+02

LOCALIDAD13 -6,20E+05 0 -5,62E+00

LOCALIDAD14 -6,97E+05 0 -4,10E+02

LOCALIDAD15 1,19E+05 0 -1,36E+02

LOCALIDAD16 1,35E+06 1,99E+05 1,80E+03

LOCALIDAD17 2,71E+06 1,73E+06 5,91E+03

LOCALIDAD18 -1,70E+07 0 -8,44E+02

LOCALIDAD19 -1,70E+07 0 -8,44E+02

TAMAÑOMICRO -7,26E+05 0 -6,61E+02

TAMAÑOPEQUEÑA 2,74E+06 1,40E+06 4,48E+03

FE1 0 0 -6,91E-07

FE2 0 0 -1,89E+03

FE3 0 0 3,66E-07

FE4 0 0 -8,22E-07

RE1 0 0 -1,20E-06

RE2 0 0 -2,60E-06

RE3 0 0 2,16E-07

RE4 0 0 -1,41E-06

DE1 0 0 3,42E-06

DE2 0 0 6,12E-06

DE3 2,69E-03 1,04E-03 3,73E-06

LQ1 -5,80E+06 0 -2,88E+03

LQ2 0 0 -1,69E+03

LQ3 0 0 8,74E-08

LQ4 0 0 -5,86E-08

ROT1 0 0 7,99E-07

ROT2 0 0 5,76E-07

ROT3 0 0 6,72E-07

ROT4 0 0 2,21E-07

ROT5 0 0 3,04E-07

ROT6 3,24E-04 1,97E-04 6,10E-07

A1 0 0 -3,18E-06

A2 0 0 -7,61E-07

A3 0 0 -2,60E-06

A4 0 0 -9,77E-08

61

VARIABLE REG. LOGÍSTICA LASSO RIDGE

A5 -4,09E-04 0 -2,25E-07

Fuente: Elaboración propia

9.6.4. Modelos aditivos (GAMS) Como se mencionó en el Capítulo 3, el modelo general aditivo transforma la función logit de la regresión logística de la siguiente forma:

log (𝜙(𝑋)

1 − 𝜙(𝑋)) = 𝛼 + 𝑓1(𝑋1) + ⋯ + 𝑓𝑘(𝑋𝑘) = 𝑿𝛽

La adaptación del GAMS para la Base de Datos se realizó mediante el paquete (gam) de R. En la Tabla 20 se muestra la ANOVA de las variables predictoras.

Tabla 20. ANOVA del GAMS para todas las variables predictoras

VARIABLE DF SUM SQ MEAN SQ F VALUE Pr(>F) SIGNIFIC.

LOCALIDAD 17 46,69 2,7462 2,2562 0,002394 **

TAMAÑO 2 28,16 14,0809 11,5685 1,03E-05 ***

FE1 1 1,62 1,6211 1,3319 0,248643

FE2 1 0,71 0,711 0,5842 0,444797

FE3 1 2,38 2,3787 1,9543 0,162319

FE4 1 0,05 0,0522 0,0428 0,836036

RE1 1 2,25 2,2516 1,8499 1,74E-01

RE2 1 0,00 0,0003 0,0003 9,87E-01

RE3 1 0,08 0,0849 0,0698 0,791728

RE4 1 1,20 1,2006 0,9864 3,21E-01

DE1 1 7,91 7,9093 6,498 0,010891 *

DE2 1 3,14 3,1391 2,579 1,08E-01

DE3 1 6,93 6,9267 5,6908 1,72E-02 *

LQ1 1 10,25 10,2463 8,418 3,77E-03 **

LQ2 1 5,25 5,2482 4,3117 3,80E-02 *

LQ3 1 4,51 4,5112 3,7063 0,054383 .

LQ4 1 0,02 0,0177 0,0146 0,903897

ROT1 1 9,54 9,5351 7,8338 5,19E-03 **

ROT2 1 4,06 4,0636 3,3385 0,067861 .

ROT3 1 8,00 7,9979 6,5709 1,05E-02 *

ROT4 1 0,04 0,0358 0,0294 0,863803

ROT5 1 0,17 0,1684 0,1384 0,709939

ROT6 1 1,51 1,5091 1,2399 2,66E-01

A1 1 0,00 0,0004 0,0004 0,984700

A2 1 0,00 0 0 0,998712

A3 1 0,00 0 0 0,999678

A4 1 4,17 4,165 3,4219 0,064520 .

A5 1 6,52 6,5173 5,3545 0,020794 *

Residuos 1620 1971,83 1,2172

62

El entrenamiento de un modelo reducido con las variables significativas al 95% toma la forma

log (𝜙(𝑋)

1−𝜙(𝑋)) = 𝑿𝛽, los valores de los coeficientes se muestran en la Tabla 21.

Tabla 21. Coeficientes del modelo de clasificación aditivo

VARIABLE COEFICIENTES (β)

(Intercept) -1,19E+00

LOCALIDAD2 -1,83E+00

LOCALIDAD3 -3,09E-01

LOCALIDAD4 -1,33E+00

LOCALIDAD5 2,64E+00

LOCALIDAD6 -3,34E-01

LOCALIDAD7 -9,13E-01

LOCALIDAD8 -1,44E+01

LOCALIDAD9 -9,87E-01

LOCALIDAD11 -1,68E+00

LOCALIDAD12 -7,80E-01

LOCALIDAD13 -8,04E-01

LOCALIDAD14 -7,87E-01

LOCALIDAD15 -1,89E-01

LOCALIDAD16 1,18E+00

LOCALIDAD17 2,72E+00

LOCALIDAD18 -1,54E+01

LOCALIDAD19 -1,49E+01

TAMAÑOMICRO -7,58E-01

TAMAÑOPEQUEÑA 2,76E+00

DE1 7,91E-10

DE3 2,30E-09

LQ1 -5,17E+00

LQ2 -1,76E+00

ROT1 1,52E-10

ROT3 3,32E-10

A5 -4,07E-10

Fuente: Elaboración propia

9.6.5. Análisis discriminante QDA El análisis discriminante cuadrático, una modificación al LDA, tiene como supuestos que las todas las variables predictoras siguen una distribución Normal para cada clase o factor de la variable de respuesta. Sin embargo, cuando la condición de normalidad no se cumple, el LDA y QDA pierden precisión, pero aún así pueden llegar a predicciones relativamente buenas (Li, Zhu, & Ogihara, 2006). En el caso particular de las predictoras existentes en este estudio no siguen una distribución Normal según la prueba de Shapiro-Wilk. Este modelo predictivo, tiene una interpretabilidad alta cuando se tienen pocas variables predictoras, además, tiene un muy bajo desempeño cuando se integran variables categóricas en los parámetros

63

de entrada, razón por la cual no se tendrán en cuenta las variables “Tamaño” y “Localidad” (Li et al., 2006). El paquete (MASS) del Software R, dispone de la función qda() la cual se utilizó para calibrar un modelo cuadrático de análisis discriminante cuyos resultados se muestran en las Tablas 22 a 27.

Tabla 22. Medias grupales para predictores de flujo de efectivo

RESPUESTA FE1 FE2 FE3 FE4

Supervivencia 9,98E+06 0.002519834 -6,13E+06 -67909.29

Fracaso -1,48E+07 -0.013407469 2,68E+06 -50382770.76

Tabla 23.Medias grupales para predictores de rentabilidad

RESPUESTA RE1 RE2 RE3 RE4

Supervivencia -1,50E+07 5,14E+04 -1,89E+07 6,21E+06

Fracaso -6,86E+07 -1,10E+14 6,28E+07 -8,62E+07

Tabla 24. Medias grupales para predictores de endeudamiento

RESPUESTA DE1 DE2 DE3

Supervivencia -1,01E+06 2,10E+06 4,49E+06

Fracaso 3,07E+08 9,81E+07 4,14E+08

Tabla 25. Medias grupales para predictores de liquidez

RESPUESTA LQ1 LQ2 LQ3 LQ4

Supervivencia 0.07317584 0.7863110 1,01E+08 8,96E+08

Fracaso 0.03895109 0.7012586 1,29E+08 8,34E+08

Tabla 26. Medias grupales para predictores de rotación

RESPUESTA ROT1 ROT2 ROT3 ROT4 ROT5 ROT6

Supervivencia 1,00E+08 1,14E+08 2,62E+08 7,20E+07 9,77E+07 4,07E+08

Fracaso 3,85E+08 2,26E+08 7,25E+08 1,94E+08 3,46E+08 1,19E+09

Tabla 27. Medias grupales para predictores del Altman Z-Score

RESPUESTA A1 A2 A3 A4 A5

Supervivencia 3,20E+05 1,64E+12 8,29E+04 8,56E+08 1,61E+09

Fracaso -1,76E+14 6,47E+04 -1,29E+14 5,38E+08 1,01E+09

9.6.6. K-Vecinos (kNN) Uno de los métodos de clasificación más utilizados es el algoritmo k-vecinos (kNN) el cual hace parte del abanico de herramientas de “machine learning”. Este modelo de clasificación se basa en la distancia, bien sea euclidiana o cartesiana, desde un grupo de observaciones conocidas hasta una que se quiere predecir. La “k” en el nombre representa la cantidad de variables de entrada que se utilizarán para predecir los resultados del modelo. Al igual que en los modelos de penalización, este parámetro se debe estimar mediante validación cruzada buscando obtener la máxima precisión posible en el conjunto de entrada. En el software R, el paquete (Caret) dispone de la función “knn3” con la cual se determina que un vecindario de 5 predictores permite obtener una precisión del 0.9513, la variación de la predicción en función del tamaño del vecindario se muestra en la Figura 39.

64

Figura 39. Precisión del modelo según el número de vecinos en el modelo kNN

Fuente: Elaboración propia

9.6.7. Máquina de soporte vectorial (SVM) Otro modelo frecuentemente empleado en el problema de clasificación de supervivencia empresarial, son las máquinas de soporte vectorial, las cuales son modelos de baja interpretabilidad y alto poder predictivo. El objetivo del modelo es generar un espacio de clasificación separado por un hiperplano, el cual se obtiene mediante funciones de inicialización con kernels (Müller & Guido, 2016). La Figura 40 muestra un ejemplo general de clasificación mediante hiperplanos en SVM. En la literatura el kernel más empleado para el problema de clasificación de fracaso empresarial es el radial, que no genera un plano recto sino una sección circular o parabólica. Esta herramienta se encuentra disponible en el paquete (e1071) del software R, el cual incluye tiene integrado un método para calibración de parámetros óptimos, mediante la función tune.svm().

Figura 40. Ejemplo de clasificación mediante hiperplanos en SVM

Fuente:(Valencia, 2018)

65

Figura 41. Curva ROC muestra de entrenamiento de la SVM con kernel Radial

Fuente: Elaboración propia

El modelo de SVM, como la mayoría de los modelos de “machine learning” no permite identificar cuáles son las variables más relevantes para la clasificación, y se evalúa únicamente por el poder predictivo frente a las muestras de entrenamiento y prueba. En la Figura 41, se muestra la curva ROC contrastada con los datos de entrenamiento, encontrando que el modelo tiene un AUC en entrenamiento de 0.8788. 9.6.8. Ensamblaje de árboles “Random Forest” Los modelos de ensamblaje como Random Forest son modelos de caja negra por excelencia. En estos, es posible determinar la importancia de las variables en relación al ensamblaje de árboles aleatorios que ocurre dentro del algoritmo. En la Figura 42 se muestra la importancia de los predictores en términos de la precisión respecto a la muestra de entrenamiento. Sin embargo, aunque se conozca la importancia de las variables para la precisión dentro del Random Forest, no es posible estimar coeficientes como en los modelos de regresión logística.

66

Figura 42. Importancia de las variables para el modelo Random Forest

Fuente: Elaboración propia

9.7. Validación de modelos y comparación de medidas de desempeño

En la Tabla 28 se muestran las métricas de “accuracy”, sensibilidad y especificidad. Adicionalmente, se calculó el valor de AUC para cada modelo. En azul aparecen aquellos con mejores resultados, destacando el poder predictivo (AUC) del modelo de penalización RIDGE, el cual es incluso superior a los modelos de “machine learning”.

Tabla 28. Medidas de desempeño predictivo de los modelos

MODELO AUC ACCURACY SENSIBILIDAD ESPECIFICIDAD

RIDGE 0,8950 0,7890 0,9167 0,7812

Random Forest 0,8910 0,9496 0,2500 0,9924

LASSO 0,8850 0,8681 0,8750 0,8677

SVM Radial 0,8773 0,9472 1,0000 0,9470

K-vecinos 0,8060 0,9520 0,2083 0,9975

67

MODELO AUC ACCURACY SENSIBILIDAD ESPECIFICIDAD

GAMS 0,7958 0,8657 0,7500 0,8728

Stepwise Reg. Log. 0,7938 0,8561 0,7500 0,8626

QDA 0,7730 0,9376 0,2083 0,9822

Fuente: Elaboración propia

9.8. Análisis de resultados y descripción de los factores de supervivencia

Los resultados de la implementación de los modelos, permiten concluir que es posible emplear modelos interpretables con un alto poder predictivo para el problema de clasificación de fracaso empresarial en empresas PYME de la ciudad de Bogotá; una gráfica comparativa de las curvas ROC se presentan en la Figura 43. El modelo que tiene el mayor poder predictivo es la regresión logística con penalización RIDGE, seguida del calificador tipo caja negra Random Forest. Entre estos dos modelos, se destaca la gran diferencia de sus métricas de sensibilidad, la cual representa la capacidad del modelo de clasificar correctamente empresas que fracasaron como “fracasadas”. En el modelo Random Forest, este valor es de apenas 0.25, indicando que el modelo no es bueno para clasificar correctamente el fenómeno de estudio; debe todo su poder predictivo a un alto valor de especificidad. En términos de consistencia entre las medidas de desempeño, los modelos LASSO y SVM son los más destacables, dado que las cuatro métricas indican alta capacidad para clasificar correctamente a las empresas. En particular, el modelo SVM con kernel radial, destaca por una sensibilidad de 1.00 y una especificidad de 0.94, es una herramienta con alta capacidad para anticiparse al fenómeno para las dos posibles categorías de la variable de respuesta; sin embargo, carece de cualquier posible explicación respecto a la importancia de las variables predictoras. En contraste, el modelo LASSO es capaz de predecir correctamente en el 85% de los casos con tan solo 6 predictores. Teniendo en cuenta que las empresas que se analizan en este trabajo tienen recursos limitados tanto físicos como de información, se considera que el modelo LASSO es una mejor alternativa de representación interpretable que RIDGE, puesto que la diferencia entre AUC es de 0.01 y el modelo LASSO sería más fácil de utilizar por un empresario que desease conocer su probabilidad de fracaso. Por lo tanto, La ecuación de regresión del modelo con el cual se analizarán los factores de supervivencia empresarial será:

𝐿𝑜𝑔 𝑂𝑑𝑑𝑠 𝐿𝐴𝑆𝑆𝑂= −3,2908 + 1.0444𝑒−9(𝐷𝐸3) + 1,4017(𝑇𝐴𝑀. 𝑃𝑒𝑞𝑢𝑒ñ𝑎) + 1,9749𝑒−10(𝑅𝑂𝑇6)+ 1,877(𝐿𝑜𝑐𝑎𝑙𝑖𝑑𝑎𝑑 5) + 1.991𝑒−1(𝐿𝑜𝑐𝑎𝑙𝑖𝑑𝑎𝑑16) + 1,727(𝐿𝑜𝑐𝑎𝑙𝑖𝑑𝑎𝑑17)

𝑃𝐿𝐴𝑆𝑆𝑂(𝑌 = 1) =1

1 + 𝑒−(𝐿𝑜𝑔 𝑂𝑑𝑑𝑠 𝐿𝐴𝑆𝑆𝑂)

68

Figura 43. Curvas ROC para los para los modelos interpretables

Tabla 29. Valor predictivo positivo y negativo modelos seleccionados

MODELO TIPO VALOR PREDICTIVO

POSITIVO VALOR PREDICTIVO

NEGATIVO

LASSO Interpretable 0.667 0.953

SVM Radial Caja negra 0.416 0.955

Fuente: Elaboración propia

En la Tabla 29 se muestran los resultados del valor predictivo positivo (VPP) y valor predictivo negativo (VPN) para los dos modelos más destacables que se construyeron. El VPP indica en este caso la probabilidad de que una empresa fracase dado que el modelo la clasificó como fracasada, por su parte, el VPN es la probabilidad de que una empresa no fracase dado que el modelo la ha clasificado como no fracasada. Las empresas que se evalúen con el modelo LASSO tienen una probabilidad de 66.7% de quiebra si el resultado de la aplicación del modelo es que van a fracasar, mientras que si se emplea el modelo SVM esta probabilidad será de 41.6%. Por otra parte, la probabilidad de que una empresa sobreviva dado que se ha clasificado como no fracasada es para ambos modelos mayor a 95%. 9.8.1. Factores de supervivencia y fracaso empresarial en PYMES manufactureras de Bogotá Del modelo predictivo seleccionado, llama la atención que solamente 2 variables asociadas a razones financieras tengan impacto en la clasificación: DE3 y ROT6; también la confirmación de que la ubicación y el tamaño de la empresa son factores influyentes.

69

Factores asociados al tamaño de la empresa Las empresas pequeñas son las más propensas a caer en la categoría de “Fracaso”, de aquellas que pertenecen al sector manufacturero en Bogotá, contrariamente a la creencia generalizada de que son las microempresas. Algunos autores creen que esta situación se presenta porque las empresas pequeñas tienen problemas para adaptarse al crecimiento del sector económico y dificultad para administrar recursos económicos (Kim,2008). Sin embargo, también puede deberse a la diferencia entre beneficios tributarios que obtienen las otras categorías. En otros países de América Latina, tales como Chile y México, existe evidencia de que cuanto más pequeñas son las empresas, menores son sus probabilidades de sobrevivir en el mercado. El tamaño de una empresa, responde a una decisión racional de los empresarios para responder a la incertidumbre del mercado, actuando de forma conservadora buscando minimizar sus pérdidas en caso de no tener éxito (Confecamaras: Red de cámaras de comercio, 2017). Las empresas de tamaño pequeño, se enfrentan a limitaciones considerables de tipo tecnológico, operacional y administrativo que disminuyen su capacidad de respuesta a la variabilidad de la demanda y nuevos competidores.

Factores asociados a la ubicación geográfica dentro de la ciudad

Las empresas ubicadas en las localidades de Usme (Loc.5), Puente Aranda (Loc. 16) y La Candelaria (Loc.17) son estadísticamente más propensas a fracasar que aquellas ubicadas en otras localidades de Bogotá. Dado que no existen estudios que evalúen el impacto de la ubicación geográfica de las distribuciones regionales de las ciudades en Colombia, no es posible determinar con exactitud las razones por la cuales estas localidades tienen mayor relevancia; aun así, si es posible determinar que tanto Usme como La Candelaria, las dos localidades con coeficientes más grandes de las tres, tienen son unas de las que tienen menores ingresos per cápita de todas las localidades(DANE, 2015; Lupiañez et al., 2014), implicando menor capacidad de compra en su entorno. La ubicación geográfica afecta debido a características como el acceso a recursos e insumos, el grado de desarrollo de la localidad y la presencia de clústeres o aglomeraciones productivas. Si esta variable se considera a nivel regional o nacional, la cercanía a proveedores o la pertenencia a un área metropolitana resultan ser características determinantes para disminuir la probabilidad de fracaso de las empresas.

Factores financieros El limitado acceso a oportunidades de crédito y la disponibilidad de recursos financieros propios, en ocasiones pueden forzar a los empresarios a recurrir a fuentes de financiamiento informales e inapropiadas (Cámara de Comercio de Bogotá, 2009; Confecamaras: Red de cámaras de comercio, 2017). Este comportamiento puede ser evaluado con las razones financieras empleadas como variables predictoras, ya que estas evalúan el desempeño operacional de las empresas. Las principales características de las empresas en quiebra son el nivel de endeudamiento y la velocidad de rotación de activos. La razón de endeudamiento DE3 (Pasivo Total sobre Activo Total) y la razón de Rotación ROT6 (Activo Total sobre Ventas) son las dos variables financieras que tienen impacto en el modelo de representación. Las empresas que tienen un nivel de endeudamiento alto (DE3 >1) y aquellas que tienen una rotación de activos baja (ROT6 >1) son más propensas a fracasar que las empresas cuyas razones de actividad son mejores y cuyos niveles de endeudamiento son bajos o nulos. a

70

10. CONCLUSIONES Y RECOMENDACIONES En este Capítulo se exponen las conclusiones del trabajo realizado en términos de la metodología empleada, y respecto a los modelos utilizados y los resultados obtenidos; adicionalmente, se mencionarán algunas recomendaciones para el desarrollo de modelos de clasificación de fracaso empresarial y el trabajo futuro. 10.1. Conclusiones respecto a la metodología La metodología de Análisis de Decisiones aplicada tiene como principales características la integración del método científico, la identificación clara de los aspectos relevantes, actores involucrados y posibles estrategias de solución (modelos) en el problema de clasificación de empresas manufactureras bogotanas según el fenómeno de fracaso empresarial; además, permite establecer claramente los criterios de evaluación de los modelos seleccionados. La Metodología Específica que se diseñó, plantea una serie de pasos con los que se logró dar solución al problema de clasificación, mediante la construcción de modelos con un alto poder predictivo y una buena interpretabilidad y contribuye a la discusión sobre la problemática de quiebra de empresas. Algunos de los pasos más importantes de esta metodología fueron la depuración de la información y el análisis de las variables predictoras, con los que se pudo asegurar un modelo de clasificación interpretable con un poder predictivo medido con un AUC de 0.885. 10.2. Conclusiones respecto a los modelos empleados y los resultados En este trabajo se mostró de qué manera con la misma información es posible construir modelos que sean interpretables y que tengan un poder predictivo igual o superior que las metodologías de caja negra. El uso de técnicas como la penalización de regresión logística, superó los resultados obtenidos con algunos de los clasificadores de machine learning más usados como Random Forest y SVM; adicionalmente incluye variables categóricas, las cuales son frecuentemente desestimadas por los analistas debido a la complejidad de su tratamiento en el diseño de modelos estadísticos. Comparativamente con el mejor modelo encontrado en la revisión de literatura, se logró una mejora de 6.5% en la capacidad predictiva de fracaso empresarial. Dicho trabajo, realizado por (Ramírez Zuluaga et al., 2017) y cuyo AUC es de 0.82, es uno de los pioneros en el país en el análisis de supervivencia en el sector “retail”. Los modelos desarrollados pueden ser de utilidad para entidades financieras y organizaciones gremiales que estén interesadas en conocer si una empresa va a sobrevivir en el futuro, como por ejemplo un banco que esté evaluando el riesgo asociado a otorgar un crédito a una empresa PYME. Además, contribuyen al estudio de quiebra empresarial que aún es incipiente en el país. 10.3. Recomendaciones y trabajo futuro Con el objetivo de validar los resultados del modelo planteado, se recomienda ampliar la muestra de empresas con la que se construyó la base de datos, de tal forma que se tenga una proporción más grande de organizaciones y que represente de mejor manera las características de las empresas estudiadas. Si bien, la cantidad de registros de empresas con los que se desarrolló este trabajo (2083) dio como resultado un nivel de clasificación alto (máx. AUC = 0.895), se espera que con una muestra más grande se llegue a conclusiones más robustas. Así mismo, se recomienda que se analice el fenómeno de fracaso empresarial en otros sectores económicos y ubicaciones geográficas; de este modo se espera entender mejor las condiciones en que las empresas del país sobreviven y establecer un punto de partida para reducir las estadísticas de quiebra.

71

Considerando que la información disponible corresponde a empresas registradas ante la Cámara de Comercio de Bogotá y legalmente constituidas, se recomienda que futuros estudios integren a aquellas empresas y establecimientos informales que han quedado fuera del alcance de este trabajo.

72

11. REFERENCIAS BIBLIOGRÁFICAS

Altman, E. I. (1968). FINANCIAL RATIOS, DISCRIMINANT ANALYSIS AND THE PREDICTION OF CORPORATE BANKRUPTCY. The Journal of Finance TA - TT -, 23(4), 589–609. https://doi.org/10.1111/j.1540-6261.1968.tb00843.x LK - https://univdelosandes.on.worldcat.org/oclc/6894994719

Angel, M. F., & Pulido, D. U. (2010). El Exito de Las Pymes en Colombia: Un Estudio de Casos en El Sector Salud. Estudios Gerenciales TA - TT -, 26(114), 77–96. https://doi.org/10.1016/S0123-5923(10)70103-0 LK - https://univdelosandes.on.worldcat.org/oclc/5141046846

Arasti, Z., Zandi, F., & Bahmani, N. (2014). Business failure factors in Iranian SMEs: Do successful and unsuccessful entrepreneurs have different viewpoints? Journal of Global Entrepreneurship Research, 4(1), 1–14. https://doi.org/10.1186/s40497-014-0010-7

Argenti, J. (1976). Corporate planning and Corporate Collapse. Long Range Planning, 9(6), 12–17. https://doi.org/https://doi.org/10.1016/0024-6301(76)90006-6

Bushe, B. (2019). The causes and impact of business failure among small to micro and medium enterprises in South Africa. Africa’s Public Service Delivery and Performance Review, 7(1), 1–27. https://doi.org/10.4102/apsdpr.v7i1.210

Cámara de Comercio de Bogotá. (2009). Informe sobre las Causas de la liquidación de empresas en Bogotá, 1–44. Retrieved from https://bibliotecadigital.ccb.org.co/handle/11520/13127#.XMxmYv1Ot8M.mendeley

Cameron, K. S., Sutton, R. I., & Whetten, D. A. (1988). Readings in organizational decline : frameworks, research, and prescriptions LK - https://univdelosandes.on.worldcat.org/oclc/964868553. Ballinger series on innovation and organizational change TA - TT -. Cambridge, Mass. SE - ix, 429 páginas : ilustraciones ; 24 cm.: Ballinger Publishing.

Caro, N. P., Guardiola, M., & Ortiz, P. (2018). Arboles de clasificación como herramienta para predecir dificultades financieras en empresas Latinoamericanas a través de sus razones contables. Contaduria y Administración. https://doi.org/10.22201/fca.24488410e.2018.1148 LK - https://univdelosandes.on.worldcat.org/oclc/8080992451

Carroll, G. R., & Hannan, M. T. (1989). On Using Institutional Theory in Studying Organizational Populations. American Sociological Review TA - TT -, 54(4), 545. https://doi.org/10.2307/2095877 LK - https://univdelosandes.on.worldcat.org/oclc/7354787412

Castillo, M. (2017). Toma de decisiones en las empresas : entre el arte y la tecnica : metodologias, modelos y herramientas. (C. F. de A. Universidad de los Andes (Bogotá, Ed.), Ediciones Uniandes (1a ed.). Bogotá: Ediciones UniAndes. Retrieved from https://univdelosandes.on.worldcat.org/oclc/209967911

Chittithaworn, C., Islam, A., & Muhd Yusuf, D. H. (2011). Factors affecting business success of small & medium enterprises (SMEs) in Thailand. Asian Journal OfSocial Science, 7(5), 180–190. https://doi.org/10.5539/ass.v7n5p180

Confecamaras: Red de cámaras de comercio. (2017). Determinantes de la supervivencia empresarial en Colombia. Cuadernos de Análisis Económico, 14, 28. Retrieved from http://www.confecamaras.org.co/phocadownload/Cuadernos_de_analisis_economico/Cuaderno_de_Anаlisis_Economico_N_14.pdf

Confecámaras: Red de Camaras de Comercio. (2016). Nacimiento y Supervivencia de las Empresas en Colombia. Cuaderno de Análisis Económico, 11, 40. Retrieved from http://www.confecamaras.org.co/phocadownload/Cuadernos_de_analisis_economico/Cuaderno_de_Anаlisis_Economico_N_11.pdf

Congreso de la República de Colombia. (2004). Ley 905 De 2004. Diario Oficial 45628. Retrieved from http://www.ncbi.nlm.nih.gov/pubmed/15003161%5Cnhttp://cid.oxfordjournals.org/lookup/doi/10.1093/cid/cir991%5Cnhttp://www.scielo.cl/pdf/udecada/v15n26/art06.pdf%5Cnhttp://www.scopus.com/inward/record.url?eid=2-s2.0-84861150233&partnerID=tZOtx3y1

Crutzen, N., & Caillie, D. Van. (2008). The business failure process : an integrative model of the

73

literature. Review of Business and Economic Literature, 0(3), 287–316. Retrieved from https://ideas.repec.org/a/ete/revbec/20080304.html

D’Aveni, R. A. (1989). The Aftermath of Organizational Decline: A Longitudinal Study of the Strategic and Managerial Characteristics of Declining Firms LK - https://univdelosandes.on.worldcat.org/oclc/5791642216. The Academy of Management Journal TA - TT -, 32(3), 577–605.

DANE. (2015). Resumen trimestral de estadísticas nacionales para Colombia. Retrieved April 15, 2019, from https://www.dane.gov.co/index.php/estadisticas-por-tema/cuentas-nacionales/cuentas-nacionales-trimestrales

Duncan, J. W., & Handler, D. P. (1994). The Misunderstood Role of Small Business. Business Economics, 29(3), 7–12. Retrieved from http://www.jstor.org/stable/23485969

Emis University. (2018). Base de datos empresas colombianas sector manufacturero. Gómez-Núñez, L., López-Gómez, S., Hernández, N., Galvis-Maldonado, M., Varela, R., Moreno, J.,

… Martínez, P. (2018). Estudio de la actividad empresarial en 2017. Estudio de La Activdad Empresarial, 70. Retrieved from http://gemcolombia.org/publications/gem-colombia-2017-reporte-nacional-2/

Hannan, M. T., & Freeman, J. (1988). The Ecology of Organizational Mortality: American Labor Unions, 1836-1985 LK - https://univdelosandes.on.worldcat.org/oclc/5545981340. American Journal of Sociology TA - TT -, 94(1), 25–52.

Harrigan, K. R. (1982). Exit Decisions in Mature Industries LK - https://univdelosandes.on.worldcat.org/oclc/5791224300. The Academy of Management Journal TA - TT -, 25(4), 707–732.

Hastie, T. J., & Tibshirani, R. J. (1990). Generalized additive models LK - https://univdelosandes.on.worldcat.org/oclc/318252808. Monographs on statistics and applied probability ; 43 TA - TT -. Boca Raton, Fla. SE - xv, 335 p. : il. ; 24 cm.: Chapman & Hall.

Hastie, T., & Tibshirani, R. (1986). Generalized Additive Models LK - https://univdelosandes.on.worldcat.org/oclc/6067084494. Statistical Science TA - TT -, 1(3), 297–310.

Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning (Second Edi). New York: Springer-Verlag New York. https://doi.org/10.1007/978-0-387-84858-7

Hazlina Ahmad, N., & Seet, P.-S. (2009). Dissecting Behaviours Associated with Business Failure: A Qualitative Study of SME Owners in Malaysia and Australia. Asian Social Science, 5(9), 98–104. https://doi.org/10.5539/ass.v5n9p98

Hosmer, D. W., Lemeshow, S., & Sturdivant, R. X. T. A.-T. T.-. (2013). Applied logistic regression LK - https://univdelosandes.on.worldcat.org/oclc/929647365. Hoboken, N.J.: Wiley. Retrieved from http://site.ebrary.com/id/10677827

Islam, A., & Tedford, D. (2012). Risk determinants of Small and Medium-sized Manufacturing Enterprises (SMEs)-an exploratory study in New Zealand. Journal of Industrial Engineering International, 8(12), 1–13.

Kosmidis, K., & Stavropoulos, A. (2014a). Corporate failure diagnosis in SMEs: A longitudinal analysis based on alternative prediction models. International Journal of Accounting and Information Management, 22(1), 49–67. https://doi.org/10.1108/IJAIM-01-2013-0001

Kosmidis, K., & Stavropoulos, A. (2014b). Corporate failure diagnosis in SMEs. International Journal of Accounting and Information Management TA - TT -, 22(1), 49–67. https://doi.org/10.1108/IJAIM-01-2013-0001 LK - https://univdelosandes.on.worldcat.org/oclc/7058330440

Li, T., Zhu, S., & Ogihara, M. (2006). Using discriminant analysis for multi-class classification: an experimental investigation LK - https://univdelosandes.on.worldcat.org/oclc/437648576. Knowledge and Information Systems TA - TT -, 10(4), 453–472.

Lupiañez, L., Bergamini, T., & López-Cózar-Navarro, C. (2014). El emprendimiento como motor del crecimiento económico. Boletín Económico de ICE, 3048, 56–63.

Lussier, R. N. (1995). A Nonfinancial Business Success versus Failure Prediction Model for Young Firms. Journal of Small Business Management, 33(1). Retrieved from https://www.questia.com/library/journal/1G1-16787401/a-nonfinancial-business-success-

74

versus-failure-prediction March, J. G. (1991). Exploration and Exploitation in Organizational Learning. Organization Science,

2(1), 71–87. Retrieved from http://www.jstor.org/stable/2634940 Mellahi, K., & Wilkinson, A. (2004). Organizational failure: a critique of recent research and a

proposed integrative framework. International Journal of Management Reviews TA - TT -, 5–6(1), 21–41. https://doi.org/10.1111/j.1460-8545.2004.00095.x LK - https://univdelosandes.on.worldcat.org/oclc/5154377152

Mihajlović, I., Schulte, P., Nikolić, N., Dhamo, Z., & Kume, V. (2015). The Reasons for SME’s Failure, Comparative Analysis and Research. In Proceedings of FIKUSZ ’15 Symposium for Young Researchers (pp. 7–22).

Mora E., M. C., & González Bravo, M. I. (2009). Caracterizaci¢n del fracaso empresarial en Colombia: un enfoque con escalado multidimensional (Working Papers “New Trends on Business Administration”. Documentos de Trabajo “Nuevas Tendencias en Dirección de Empresas”.). Interuniversity Research Master and Doctorate Program (with a quality mention of ANECA) on “Business Economics”, Universities of Valladolid, Burgos, Salamanca and León (Spain). Until 2008, Interuniversity Doctorate Program (with a quality mention of ANECA. Retrieved from https://econpapers.repec.org/RePEc:ntd:wpaper:2009-11

Müller, A. C., & Guido, S. (2016). Introduction to Machine Learning with Python : A Guide for Data Scientists LK - https://univdelosandes.on.worldcat.org/oclc/1026251682. TA - TT - (1a ed oct.). New York SE - XII, 380 p. : il. ; 23 cm.: O’Reilly Media.

Ortiz Anaya, H. (1998). Analisis financiero aplicado : con ajustes por inflación LK - https://univdelosandes.on.worldcat.org/oclc/318224592. TA - TT - (10a. ed.). Bogotá SE - 729 p. ; 24 cm + 1 disquete (3 1/2 plg.): Universidad Externado de Colombia.

Parra, J. F. (2011). Determinantes de la probabilidad de cierre de nuevas empresas en Bogotá LK - https://univdelosandes.on.worldcat.org/oclc/7181518531. Revista Facultad de Ciencias Económicas.

Platt, H. D., & Platt, M. B. (2004). Industry-relative ratios revisited: The case of financial distress. FMA 2004 Meeting, New Orleans (USA).

Ramirez Echeverry, H., & Vanegas Garavito, B. (2008). Gestión de costos en las pymes: problemática y alternativas de solución. Universidad Libre. Retrieved from https://books.google.com.co/books?id=ht2RtAEACAAJ

Ramírez Zuluaga, J. A., Valencia Arboleda, C. F., Torres Cadena, G., & Handl, J. (2017). GAMSEL methodology application to provide a balance between interpretability and flexibility in the bankruptcy prediction problem LK - https://univdelosandes.on.worldcat.org/oclc/1027985371. Uniandes, Bogotá TA - TT -. Retrieved from http://biblioteca.uniandes.edu.co/acepto201699.php?id=12033.pdf

Rane, S. (2018). The balance: Accuracy vs. Interpretability. Retrieved November 28, 2019, from https://towardsdatascience.com/the-balance-accuracy-vs-interpretability-1b3861408062

Richardson, B., Nwankwo, S., & Richardson, S. (1994). Understanding the Causes of Business Failure Crises: Generic Failure Types: Boiled Frogs, Drowned Frogs, Bullfrogs and Tadpoles LK - https://univdelosandes.on.worldcat.org/oclc/202634534. MANAGEMENT DECISION -LONDON THEN BRADFORD- TA - TT -, 32(4), 9.

Rivera Rodríguez, H. A. (2012). Perdurabilidad empresarial: concepto, estudios, hallazgos. Business Durability: Concept, Research, Findings., 28(47), 103–113. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&db=fua&AN=86028849&lang=es&site=ehost-live

Romero Espinosa, F., Molina Melgarejo, Z. A., & Vera-Colina, M. A. (2015). Fracaso empresarial de las pequeñas y medianas empresas (pymes) en Colombia TT -. Suma de Negocios TA -, 6(13), 29–41. https://doi.org/10.1016/j.sumneg.2015.08.003 LK - https://univdelosandes.on.worldcat.org/oclc/6832792922

Ropega, J. (2011). The Reasons and Symptoms of Failure in SME. International Advances in Economic Research TA - TT -, 17(4), 476–483. https://doi.org/10.1007/s11294-011-9316-1

Sanabria Landazábal, N. (2012). Perdurabilidad empresarial Anotaciones teóricas. Pensamiento & Gestión, (32), 190–224. Retrieved from

75

http://search.ebscohost.com/login.aspx?direct=true&db=bth&AN=82498151&lang=es&site=ehost-live

Santana, L. (2017). Determinantes de la supervivencia de microempresas en Bogotá: un análisis con modelos de duración. Innovar TA - TT -, 27(64), 51–62. https://doi.org/10.15446/innovar.v27n64.62368 LK - https://univdelosandes.on.worldcat.org/oclc/7186098226

Sharma, S., & Mahajan, V. (1980). Early Warning Indicators of Business Failure. Journal of Marketing TA - TT -, 44(4), 80–89. https://doi.org/10.1177/002224298004400412 LK - https://univdelosandes.on.worldcat.org/oclc/7947230142

Shonesy, L., & Gulbro, R. (2019). SMALL BUSINESS SUCCESS: A REVIEW OF THE LITERATURE. Stead, E., & Smallman, C. (1999). Understanding Business Failure: Learning and Un-Learning

Lessons From Industrial Crises LK - https://univdelosandes.on.worldcat.org/oclc/205629603. JOURNAL OF CONTINGENCIES AND CRISIS MANAGEMENT TA - TT -, 7(1), 1–18.

Tibshirani, R. (1996). Regression Shrinkage and Selection via the Lasso. Journal of the Royal Statistical Society. Series B (Methodological), 58(1), 267–288. Retrieved from http://www.jstor.org/stable/2346178

Valencia, C. (2018). Apuntes de clase “Statistical Learning Data Analitycs.” Bogotá: Universidad de los Andes.

Velásquez Pérez, L. (2003). Estudio del alcance de la implantación de tecnologías de información, como apoyo al mejoramiento de los proceos, en las pequeñas y medianas empresas del sector manufacturero en Bogotá. Pontificia Universidad Javeriana. Retrieved from https://www.javeriana.edu.co/biblos/tesis/ingenieria/tesis18.pdf

Yip, A. Y. N. (2006). Business Failure Prediction:: A Case-Based Reasoning Approach. Review of Pacific Basin Financial Markets & Policies, 9(3), 491–508. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&db=bth&AN=22271790&lang=es&site=ehost-live

76

ANEXO A