agosto 17, 2015
Cuarta columna de la sección General Management, escrita por el profesor Pablo Marshall y publicada el sábado 15 de agosto en El Mercurio.
El big data tiene potencial para crear valor en diversos sectores económicos, pues mejora la productividad y aumenta la competitividad y los excedentes económicos para consumidores y todo tipo de organizaciones.
Considere la evolución de una librería que hasta hace pocos años vendía libros en un local físico. El dueño registraba las ventas de los distintos autores y géneros. Eventualmente, un programa de lealtad permitía registrar información a nivel individual de los clientes y desarrollar una gestión comercial personalizada.
Pero el escenario cambió radicalmente cuando apareció en el mercado una tienda que vende libros online que no solo conoce lo que los clientes han comprado históricamente; también, qué otras cosas buscan en la web, cómo son sus patrones de navegación, cómo reaccionan a promociones, cuál es el nivel de satisfacción con la tienda y qué nuevos productos o formatos de libros prefieren. La tienda online también puede acceder a una gestión más eficiente de su negocio a través de otras fuentes de información: medios de distribución, logística, inventarios, insumos, etc…
Pero el escenario cambió radicalmente cuando apareció en el mercado una tienda que vende libros online que no solo conoce lo que los clientes han comprado históricamente; también, qué otras cosas buscan en la web, cómo son sus patrones de navegación, cómo reaccionan a promociones, cuál es el nivel de satisfacción con la tienda y qué nuevos productos o formatos de libros prefieren. La tienda online también puede acceder a una gestión más eficiente de su negocio a través de otras fuentes de información: medios de distribución, logística, inventarios, insumos, etc…
La forma tradicional de vender libros parece obsoleta y en sinergia con esta nueva forma está el big data: información sobre los clientes, la localización de medios de distribución, la satisfacción de las experiencias de compra, sus preferencias, etc.
Hay empresas que han nacido en la era digital para las cuales el big data es natural porque forma parte integral de su estrategia de negocio desde su creación como www.amazon.com, www.ebay.com, www.twitter.com o www.netflix.com. Otras empresas, más tradicionales o que nacieron antes de la era digital, han adquirido innovaciones tecnológicas y aplicaciones de big data que les permiten incorporarse al nuevo mundo digital; ejemplos de estas aplicaciones son www.booking.com, www.foursquare.com y www.priceline.com.
En muchos sectores de la economía
El big data tiene potencial para crear valor en diversos sectores de la economía, mejorando la productividad en distintos tipos de organizaciones, aumentando la competitividad entre empresas y los excedentes económicos para consumidores, empresas privadas y organizaciones gubernamentales.
En el área de la salud, puede ser determinante en mejorar la productividad, la calidad de la atención a los pacientes y en la creación de innovaciones. La FDA en EE.UU. ha autorizado recientemente la comercialización de un sensor, que se puede ingerir como una píldora, que mide tan solo 1 mm2, que en contacto con los ácidos del estómago se activa para transmitir información médica de la persona, como la actividad del corazón, temperatura, actividad física y medicamentos ingeridos.
En los servicios de gobierno, aplicaciones del big data han generado mayor transparencia, como www.gobiernotransparentechile.cl o www.data.gov, información más temprana para detectar necesidades y soluciones innovadoras en comunidades como el sitio de la ONU www.globalpulse.com.
El retail es uno de los sectores de actividad donde el big data tiene mayores aplicaciones. Algunas de estas se refieren a: (a) la venta cruzada de nuevos productos, (b) la optimización de inventarios a partir de mejores modelos de predicción de demanda, (c) mejoras en logística y distribución mediante el uso de sensores de localización GPS, (d) el márketing a consumidores en el punto de venta, (e) el análisis de sentimiento de los mensajes que los consumidores reportan en redes sociales o en comunidades de clientes y (e) nuevos modelos de negocio.
La industria manufacturera también se ha beneficiado del big data: en el monitoreo en tiempo real de partes y productos, en ideas y diseño de nuevos productos, en la predicción de demanda y en el servicio de posventa.
Una marca de automóviles utiliza actualmente sensores en las distintas piezas que participan del proceso de fabricación de los automóviles de manera de detectar imperfecciones oportunamente. Este proceso permite mejorar los tiempos y costos de fabricación y comercialización y la calidad del producto que recibe el consumidor.
Pero los datos en bruto que producen los sistemas de captura del big data requieren la mayoría de las veces un proceso para transformarlos en información y luego en insight que se pueda traducir en acciones; lo que se conoce como business intelligence.
Tres desafíos
Los desafíos más significativos del big data tienen que ver con: el almacenamiento de los datos; la visualización y, posteriormente, el análisis. En almacenamiento, las bases de datos tradicionales no son eficientes para manipular grandes conjuntos de datos y no están acondicionadas para manejar datos no estructurados como son los que se generan en proyectos de big data.
Mucha investigación relacionada con big data hoy en día tiene que ver con la arquitectura de base de datos para: almacenar enormes conjuntos de datos que crecen aceleradamente, acceder a los datos de manera rápida y relacionar fuentes de datos diversas.
Respecto del segundo gran desafío, se requiere llevar los grandes volúmenes de datos a escala humana para poder visualizar la información, ganar insight y poder desarrollar hipótesis para el análisis posterior.
Por ejemplo, los partidos de baloncesto de la NBA, desde hace varios años son grabados con varias cámaras que capturan todos los detalles mientras se desarrolla el juego. Profesores de la Universidad de Harvard han procesado estos datos en bruto para analizar los intentos de gol de jugadores y equipos.
Para los cerca de un millón de intentos de gol registrados en un período de cinco años se ha determinado la posición exacta en la cancha desde donde se realiza un lanzamiento y si este fue exitoso o no, lo cual se puede representar gráficamente en un mapa de la cancha, donde se marca la frecuencia de las distintas posiciones y la efectividad. Los mejores jugadores tienen un amplio espectro de posiciones y alta efectividad en los lanzamientos. Todo esto permite diseñar mejor los entrenamientos y las estrategias de juego contra el próximo adversario.
El tercer desafío del big data tiene que ver con el análisis de los datos para ganar insight en la toma de decisiones. En este sentido, una pregunta que todavía se hacen los científicos es si el big data reemplazará a la estadística y la forma tradicional de analizar información.
En 2009, la prestigiosa revista científica Nature publicó un estudio, en el cual, mediante el uso de millones de búsquedas que realizaban las personas en internet, como por ejemplo “farmacias cercanas a mí” o “síntomas de la influenza”, se lograba predecir el brote de influenza en EE.UU. de manera más precisa y rápida que con los métodos tradicionales.
Este estudio se transformó en un emblema del uso del big data y de la nueva tendencia en negocios, tecnología y ciencia. Cuatro años después, la misma metodología reportaba errores de más del 50% en la predicción del brote de influenza del invierno 2012-13.
Estudios posteriores que analizaron este error nos han mostrado que la gran cantidad de información contenida en proyectos de big data, que se basan más en correlaciones que en relaciones causales respaldadas por un marco conceptual, no son sustituto, sino complemento de la forma tradicional de analizar los fenómenos en negocios como son el small data y el juicio de expertos.
La tecnología ha desarrollado un sensor que se ingiere como una píldora y que en contacto con los ácidos del estómago se activa para transmitir información médica de la persona.
Las 5 V: volumen, variedad, velocidad, veracidad y valor
El big data se define a través de lo que los expertos han denominado las 5V: volumen, variedad, velocidad, veracidad y valor.
La primera característica naturalmente es el volumen. La cantidad de información hoy en día es de un orden de magnitud muy superior a lo que hemos estado acostumbrados a almacenar y procesar. Estimaciones de expertos señalan que en los últimos dos años se han generado más datos que en toda la historia previa de la humanidad.
Pero, quizás si una de las características más significativas no sea el volumen, sino la variedad. Mientras los datos tradicionales tienen una forma estructurada y usualmente numérica, la revolución de big data contiene información no numérica y no estructurada: mensajes de texto, fotos, videos, audios, ubicaciones geográficas, lecturas de sensores, etc… Las bases de datos tradicionales no están diseñadas para manejar este tipo de datos no estructurados, por lo cual se requieren adaptaciones. Mucho se ha avanzado en el análisis de texto o text mining para análisis de concepto y sentimiento.
Por ejemplo, una empresa que vende café crea una comunidad virtual de clientes que pueden proponer ideas de nuevos productos, compartir experiencias y reaccionar a propuestas de nuevas ideas y promociones de la compañía. Los mensajes compartidos en esta comunidad pueden ser analizados mediante técnicas de text mining.
La velocidad es otra de las características de big data. En muchas aplicaciones los datos solo tienen sentido si pueden procesarse en tiempo real. Considere el caso de un casino de juegos de azar que se comunica con sus clientes en tiempo real mientras están en la sala de juegos de manera de darle más valor a la experiencia de juego. Pocos años atrás, este casino se relacionaba con sus clientes a través de medios masivos y en forma directa debido a un programa de lealtad. Pero, en ambos casos, la comunicación se producía fuera de la sala de juegos, mientras que ahora se lleva a efecto en el momento en que el jugador toma sus decisiones más significativas.
La veracidad de los datos se refiere a que antes de usar y poder hacer predicciones a partir de big data se requiere determinar su validez y calidad.
Finalmente, el valor de big data para personas y organizaciones se deriva de nuevos y mejores productos y servicios, mayor productividad, menores costos, mejores formas de comunicación y mayor transparencia.
Cuarta columna de la sección General Management, publicada el sábado 15 de agosto en El Mercurio.