lunes, 2 de febrero de 2015

Big data: tratamiento masivo de datos. Guía para entender qué es el big data de una maldita vez. Ramón Archanco, 13 de enero de 2015


Guía para entender qué es el big data de una maldita vez


qué-es-el-big-data


Llevo bastante tiempo leyendo sobre Big Data,Small Data, Internet de las cosas etc… y hablando con decenas de profesionales en las empresas sobe este tema. Lo que termino de concluir es que hay mucha confusión derivada, consciente o inconscientemente sobre el termino y que esto provoca que no respondamos adecuadamente qué es el big data.
Así, el big data se ha convertido en un termino de moda para consultores y directivos sin saber en muchos casos de lo que hablan.
¿Cómo un director que no sabe lo que es Google Analytics puede saber algo sobre el big data?
Da igual, lo importante es que nadie nos pase por la derecha y si hay que decir que “yo soy el big data” lo haremos.
En este sentido y como primera aproximación al entorno en el que nos movemos, gestión de información-datos generados fuera de las empresas, me he atrevido a hacer esta primera clasificación que quiero compartir con vosotros para poder recibir la crítica u orientación oportuna, dado que es mi intención darle aire en este blog al debate sobre qué es el big data y hacia donde debería ir dentro de la empresa.

Sin Internet no podemos entender qué es el big data

El llamado Big Data, está generando una enrome confusión derivada de una visión parcial del observador.
La inmensa profusión de datos e informaciones que aparecen derivados del proceso de digitalización que esta sufriendo el mundo, nos está llevando a una auténtica revolución en la forma de gestionar procesos productivos, aplicaciones y nuestra propia vida.
Así como la manera de entenderlos y de compartirlos.
los tres niveles del big data
Infografía cortesía de Iñaki Oroz
El Big Data se da a mi entender en tres niveles:

Nivel 1 o Nivel Consciente del World Wide Web:

Esta es la información y datos puestos en la Red por decisión consciente  de personas y empresas:
  • Webs, Blogs, medios…
  • Redes sociales: Twitter, LinkedIn, Facebook
  • Bases de datos
Los volúmenes de esta informacion y estos datos son claramente inferiores a los de otros niveles y aun así, su tamaño es abrumador. Van desde los pequeños cambios que pueden apreciarse en una web (precios, anuncios, descripciones) a artículos o publicaciones científicas o la informacion que compartimos en redes sociales.
Millones de items diarios.
¿Cual es el valor de todo esta información? Su valor reside en comunicar, compartir conocimiento. analizar, relacionar y facilitar predicciones de comportamiento, avances tecnológicos, prevenir epidemias (Twitter), identificar inversiones, detectar oportunidades y amenazas. En la vida personal reconocer objetos y disponer de información avanzada, o simplemente el tráfico o el mejor  estacionamiento, o la mejor oportunidad para hacer una compra…
Sus aplicaciones son muchísimas y están al alcance de la gran mayoría de las organizaciones.

Nivel 2 o Nivel inconsciente de la generación de datos

Es lo que se conoce como el Automatic Personal Data (APD) o datos generados por uso de dispositivos por parte de las personas, como ordenadores, smartphones y apps de dispositivos.
La generación de estos datos es inconsciente por parte de los individuos pero proveen de un montón de información sobre donde estamos, nuestros gustos, y actividades. Como comprenderás aquí se generan una cantidad brutal de datos que las empresas están dispuestas a explotar.
El valor de estos datos es muy alto ya que permiten:
  • La reducción de costos de todo tipo,
  • El análisis de comportamientos,
  • La gestion y optimizacion de la publicidad,
  • La geolocalización y gestion del tráfico,
  • Así como la planificación de suministros, seguridad, salud, gestión avanzada de recursos al servicio de los ciudadanos,
Sus aplicaciones son muchísimas pero los datos pertenecen a un grupo selecto de compañías a los que les cedemos la propiedad de estos datos y que pueden hacer el uso que más les convenga.
No son datos de dominio publico como ocurre con los del nivel 1 y por lo tanto solo pueden ser explotados por empresas de telecomunicaciones o de nuevas tecnologías.

Nivel 3 o Nivel impersonal de los datos, la Internet de cosas

El tercer nivel es el nivel de donde se producen e intercambian datos entre máquinas. Es lo que se conoce como el Internet de las cosas.
La generación de estos datos tiene como origen la interactuación de las máquinas entre ellas.
Las aplicaciones pueden ser amplísimas pero sobre todo se habla en este campo de las Smart cities o plantas de producción autogestionadas.
¿Te suena eso de almacenes totalmente controlados por máquinas o las redacciones de periódicos sin periodistas o  los vehículos sin conductor, la ropa inteligente, electrodomésticos, controles de fuga de agua o consumo eléctrico?
Pues esta es la Internet que lo hace posible.
Su gran valor reside en:
  • Reducción de costos de todo tipo.
  • Control eficiente de máquinas, organizaciones, cultivos, agua, petróleo, energía, suministros, transporte de mercancías, prevención de catástrofes. …
Son muchas las aplicaciones que pueden desarrollarse en ese campo y donde la figura delcientífico de datos cobra especial relevancia.

¿Lo que no quieren que sepas sobre qué es el big data?

El problema del termino Big Data no es el mismo termino en si, sino el significado interesado que le pretenden dar.
Está claro que Big data es tratamiento masivo de datos. ¿Pero de que datos?
Lo que planteo. No es aclarar el termino, sino intentar al menos diferenciar los tres grandes campos en los que se mueve la información y los datos que aparecen derivado de la digitalización.
En este sentido, el problema es que los periodistas, los consultores, los ponentes etc… cuando nombras la palabra “big data” solo parecen querer dar espacio para el Internet de las cosas y ahora poco a poco también al APD.
Tal vez porque es el nivel que más esperanzas suscita o porque es el más tangible o porque determinados agentes de la industria están trabajando descaradamente en ello para monopolizar el termino y concionar las inversiones.
Hice la prueba el otro día en una conferencia del presidente de ANFAC, haciendo una mención al termino centrado en el nivel 1 y a la salida estaba rodeado. ¿Por qué? Porque la mayoría de las personas y directivos solo oye hablar sobre Big Data casi exclusivamente relacionado con el nivel 3 y algo con el 2.
Y claro las empresas que pueden hacer uso del Big Data en esos dos niveles no son muchas. Sin embargo desde el punto de vista del Big Data de nivel 1 cualquier empresa puede empezar a explotar esos datos porque para empezar su titularidad es pública.
Aquí todas las organizaciones tienen la oportunidad de auto mejorarse.
Corresponde al mundo de las empresas y a sus directores tener al cliente en el centro de sus decisiones, controlar a la competencia y observar lo que se dice y hace en la WWW por parte de otras personas, empresas e instituciones.
El APD, según mis investigaciones, va estar en manos de empresas especializadas donde su modelo de negocio se base claramente en la explotación de los datos obtenidos por sus dispositivos o aplicaciones.
Esto ya lo hacen Google y Amazon. Pero iremos viendo cantidad de Start Ups que se posicionaran en este espacio.
De hecho por lo que he podido informarme hablando con operadores, agencias y empresas,  es un mercado ya estructurado donde hay vendedores de espacios (medios y nuevos agentes con públicos fidelizados, google, blogs..), integradores distribuidores de espacios, y al otro lado estamos las personas escrutadas por nuestros Smart, dibujando nuestro perfil de compartimiento, que leído por quien dispone de estos datos (las telefónicas, Apps, Google..) venden a los primeros o a los distribuidores el target de perfiles concretos para hacer la publicidad más precisa que hayamos podido conocer.
En el APD es donde más dinero se está metiendo y donde creo el Big Data más va a desarrollarse en los próximos años. Dando lugar a servicios avanzados que las empresas podremos adquirir.
Para mí, lo importante es saber dónde estamos, donde están los demás, y luego ser capaces de integrar de manera consciente a la organización cada uno de los niveles del Big Data si fuera necesario.
Pero sin atragantarse.
Todavía la mayoría de los directivos desconocen términos como RSS o Google News así que imagínate lo que es hablar del tratamiento de datos en la empresa al nivel del BIG DATA.
En este sentido, creo que ante el interés que suscita Big Data, debemos tener muy claro cuál de sus tres niveles es que nos puede ayudar.

En conclusión qué es el Big Data

La popularización de conceptos como “Big Data” asimilado a la gestión masiva de datos está facilitando una creciente confusión que iguala de forma muy frívola una parte del fenómeno con el todo.
Lo hemos vivido con el “marketing”, concepto que hoy muchas personas lo asimilan a publicidad, cuando es un concepto mucho más rico y profundo. “Este producto lo único que tiene es mucho marketing”, para querer decir que no vale nada, que es puro resultado de un esfuerzo publicitario.
La aparición de INTERNET, o la incorporación de técnicas digitales a nuestra forma de relacionarnos, entendernos, documentarnos etc, está produciendo un tremendo “shock” en todos los agentes.
A finales del siglo pasado nace INTERNET y aun hoy pocas personas están siendo capaces de asimilar la información que nos facilita. Por si no fuera poco, en la primera década del presente siglo, nosotros como personas nos convertimos en fuente masiva de información, como consecuencia de dos grandes fenómenos:
  1. El primero derivado de acciones voluntarias de las personas, relacionado con las  “redes sociales, blogs”, etc
  2. Y  el segundo, la producción inconsciente de información y datos, que aparecen por el uso de dispositivos que  permiten a terceros conocernos y predecir nuestro comportamiento como nunca antes hubiéramos imaginado.
En esta contexto y para complicarlo todo nos encontraremos con una jerga de nombres para intentar poner “apellidos” a las diferentes formas de definir esta serie de fenómenos tan dispares para decir lo mismo. Lo cual dificulta a las organizaciones algo que debería ser una prioridad, tener un plan en el que ir incorporando los datos, la información y los hechos a sus procesos productivos.
Para poder enfrentarnos a este contexto, lo mejor es tener muy en cuenta cuales son las ventajas de tener una estrategia de análisis de datos para tu empresa.

No hay comentarios :

Publicar un comentario en la entrada

Muchas gracias por comunicarse. GABY

Related Posts Plugin for WordPress, Blogger...

ARGENTINA PORTAL

NOTA

. Las imágenes en el Blog que no son propias son elegidas, en su mayoría, de Google Imágenes. Se agradece la posibilidad de poder utilizarlas con fines educativos y de difusión cultural.
.Los artículos publicados provienen de elaboración propia, de los autores y las páginas WEB mencionadas en cada uno de ellos. Nuevamente se agradece la posibilidad de poder utilizarlos con fines educativos y culturales.
. Las opiniones vertidas en el blog son responsabilidad de quienes las emiten.
. Se autoriza a utilizar información contenida en este blog siempre que se mencione la fuente.

IBSN

IBSN: Internet Blog Serial Number 2012-11-20-12

LICENCIA CREATIVE COMMONS

Licencia Creative Commons
El docente profesional por Gaby Bibliotecaria de Argentina se encuentra bajo una Licencia Creative Commons Atribución-NoComercial-SinDerivadas 3.0 Unported.
Basada en una obra en http://eldocenteprofesional.blogspot.com.ar/.