El Paradigma del Big Data.
El concepto del Big Data es una entelequia que circula como término habitual entre los más “snobs” de los foros profesionales, y del cual no escapa siquiera el ámbito ambiental. Pero… ¿sabemos realmente a qué nos referimos cuando hablamos de big data?, ¿Qué aportan de nuevo respecto a nuestras hojas de cálculo más clásicas? ¿Dónde está el límite de lo “big”?.
Pues bien, en el presente artículo vamos a intentar dar un repaso a este concepto, aplicado fundamentalmente a nuestro campo: el medio ambiente, definiendo lo que para nosotros sería un sistema basado en el big data ambiental real, y las oportunidades y campos que se abren en este punto para la gestión ambiental clásica.
Medir para conocer.
En medio ambiente, como en la mayoría de los ámbitos profesionales, antes de actuar para llevar a cabo una mejora, cambio u optimización de cualquier área, lo que tenemos que hacer es caracterizarla. Y la caracterización de cualquier área ambiental solo se puede conseguir, a su vez, conociendo los parámetros básicos que la definen, algo que fundamentalmente se alcanza midiéndolos.
Sin embargo, una vez conocido el poder del dato matemático poca gente se resiste a medir, y es aquí donde nos encontramos con el principal problema, y es que hoy en día se generan datos sin control, volúmenes ingentes que, sin embargo, no encuentran ninguna salida inteligente, quedando condenados al ostracismo del simple almacenamiento sin que nadie les haga caso.
Generamos varios Zettabytes al año y no sometemos a análisis mucho más del 0,5% de los mismos, quedando el resto de datos almacenados sin mayor aprovechamiento.
De hecho, actualmente estamos en la era de la información, y pocas veces ha habido en la historia un mayor volumen de ignorancia. A este hecho no escapan tampoco las áreas ambientales, que cada día cuentan con un mayor número de información, generada por redes de calidad del aire, de las aguas, registros de gestión, control de procesos, redes sensoriales, sistemas de detección, medición, etcétera… ahora bien, ¿para qué?.
Los datos ambientales están claramente infrautilizados, sirviendo como mucho para el control periódico o puntual en base a una única referencia (un valor límite, una lectura anterior, etc), convirtiendo el dato en una cifra tonta, estática, y de usar y tirar.
De esta forma, es muy común que nos encontremos con megabytes de datos almacenados que sólo fueron revisados o mirados una vez, para comprobar cualquier requisito, y que nadie más se ha molestado en estudiar. Toneladas de información que caen en el olvido de un registro o copia de seguridad sin mayor uso, cuando lo que esconden en su interior es todo un tesoro: La verdadera realidad de las áreas ambientales a las que nos enfrentamos en el día a día.
El Verdadero BIG DATA.
En el escenario descrito es donde hace su aparición estelar el verdadero “Big Data”, encargándose del estudio de los parámetros a medir y controlar, de su organización e interrelaciones, del control de sus evoluciones, del diseño de redes útiles y del desarrollo de nuevas herramientas, como el “data minning” (minería de datos), para extraer de grandes volúmenes de datos conclusiones sencillas y fiables que presenten una utilidad verdadera, como si de un bateador de oro se tratase, filtrando de todo el barro la información que realmente merece la pena y que aporta conclusiones de utilidad al problema en estudio.
De esta forma, el objetivo de todo buen sistema de “big data” será siempre la obtención de un conocimiento práctico del entorno en estudio, proporcionando un análisis sencillo tanto de la situación en tiempo real como de su evolución a futuro, detectando patrones de comportamiento y proporcionando escenarios de caracterización del entorno que permitan un análisis sencillo y efectivo de riesgos y oportunidades, así como la generación de predicciones.
Comprobará el lector que aquí no hablamos del tamaño de los datos, porque realmente en el “big data” realmente el tamaño no importa, lo que importa es la forma en la que planteamos su captura, gestión y estudio, siendo este el verdadero espíritu.
BIG DATA allá donde mires.
En Ideas Medioambientales algo de experiencia tenemos en el big data ambiental, aunque mucha menos de la que nos gustaría, pues somos conscientes de que el futuro de nuestra profesión pasa en gran parte por esta área del análisis estadístico tan apasionante.
Nuestro trabajo en el diseño de redes sensoriales aplicadas al medio natural y al entorno forestal, como por ejemplo en aplicaciones para la prevención y detección de incendios, nos ha llevado a darnos cuenta de la importancia de generar una sólida base de medición y control inicial que aporte una información útil, organizada y coherente a los objetivos perseguidos. No se trata de medir por medir, sino de controlar lo que realmente necesitamos y de saber aprovechar los recursos de que se dispone, internos y externos.
Nuestra experiencia en sectores como el de la explotación de redes de control de la calidad del aire nos ha permitido darnos cuenta del potencial que hay detrás de la minería de datos de grandes series históricas, más aún cuando las puedes cruzar con otras series de interés como las meteorológicas o las de control de tráfico. Hemos ido más allá del cálculo estadístico básico para comprobar el cumplimiento de valores límite, umbrales y objetivos, y hemos utilizado software de minería que nos ha permitido tener la posibilidad de estudiar evoluciones, hacer previsiones, analizar escenarios o incluso detectar fuentes de emisión cercanas.
Nos quedará buscar nuevas líneas de trabajo en áreas de interés para las que tenemos grandes ideas y en las que estamos seguros que el “Big Data Ambiental” aportaría un alto valor añadido.
La imaginación es muy osada, y de hecho es el único límite que se encuentra el big data hoy en día. Basta pensar en los diversos sectores ambientales de mayor relevancia para darnos cuenta del potencial que el big data tiene en áreas como:
- La gestión del ciclo del agua en las ciudades. ¿se imaginan aplicar el big data tanto en la potabilización y consumo, como en la gestión de los vertidos y su tratamiento? Podríamos adaptar los servicios a las necesidades, tanto del ciudadano como del entorno, adaptarlos a cada escenario o situación, detectar fugas en el instante.
- El control de las emisiones en industrias. ¿se imaginan aplicar el big data para el análisis de la evolución de los parámetros en función de los procesos, de las condiciones meteorológicas, etc?
- El control de la calidad del aire. ¿se imaginan lo que se podría extraer de los datos existentes si se hiciese una buena minería de datos seria sobre los mismos? Algo ya vimos en el post “La calidad del aire que respiramos en Albacete”, pero ¿se imaginan hasta donde se podría llegar? ¿se imaginan crear redes sensoriales en segundo plano complementarias a las redes oficiales o para el control de parámetros y afecciones específicas como olores, emisiones de tráfico, etc?
- Los proyectos de biodiversidad y servicios ecosistémicos, haciendo uso de las nuevas herramientas tecnológicas existentes (sensores, TIC, teledetección, etc).
- (…)