Qué es el Big Data y por qué lo abarca todo

El Androide Libre

Qué es el Big Data y por qué lo abarca todo

Qué es el Big Data. Os mostramos en qué consiste y todas las repercusiones que puede acarrear consigo. Tanto en móvil como en sociedad.

jangelzamora

Publicada 11 abril 2016 23:10h

Actualizada 11 abril 2016 22:10h

De repente, el Big Data (o Datos Masivos) está en todas partes. Pero, ¿es el Big Data un monstruo (quizá familiar de BigFoot) o no? Prácticamente de un día para otro, nuestros dispositivos móviles nos sugieren información y se adelantan a nuestros pensamientos de una forma que podríamos pensar que es caso de brujería.

Ya no necesitamos recordar dónde hemos aparcado, o buscar el tiempo que hará en nuestras próximas vacaciones. Todo el mundo parece estar recolectando datos, analizándolos y, sobre todo, generando beneficios gracias al poder de los datos. Todo está ahí, en algún lugar, en todos lados.

La era de los datos ha llegado, y parece haber llegado rompiendo moldes. Pero, ¿en qué consiste el Big Data? ¿Qué ventajas e inconvenientes trae consigo? ¿Cuáles son las consecuencias?

El Big Data: datos por todas partes

Casi todos habréis oído hablar del Big Data, pero existe una gran confusión sobre en qué consiste realmente. Por ello, en primer lugar intentemos darle un poco de significado a este concepto. Si buscamos su definición en Internet, encontraremos lo siguiente según Wikipedia:

El Big Data es un concepto que hace referencia al almacenamiento de grandes cantidades de datos y a los procedimientos usados para encontrar patrones repetitivos dentro de esos datos. El fenómeno del Big Data también es llamado datos a gran escala. En los textos científicos en español con frecuencia se usa directamente el término en inglés Big Data, tal como aparece en el ensayo seminal de Viktor Schönberger Big data: La revolución de los datos masivos.

Cuando hablamos de Big Data, nos referimos a la gestión/análisis de grandes cantidades de datos, la cual no puede ser tratada de manera convencional debido a la limitación de las herramientas convencionales de procesamiento de datos.

De ahí que cuando se habla de Big Data, no sólo se habla de gestión y análisis de datos. También englobamos infraestructuras, tecnologías y servicios que han sido creados para dar solución al procesamiento de enormes conjuntos de datos estructurados, no estructurados o semiestructurados (mensajes en redes sociales, señales de móvil, archivos de audio, sensores, imágenes digitales, datos de formularios, emails, datos de encuestas…) que pueden provenir de sensores, micrófonos, cámaras, escáneres médicos, imágenes o un sinfín de posibilidades.

Además, lo ideal de esta gestión de datos es que sean procesados en tiempo real, para poder facilitar la toma de decisiones instantánea, pues los sistemas de hoy día necesitan ese factor de inmediatez. ¿Comprendemos ahora algo mejor lo que es el Big Data? Si queréis afianzar el concepto, no dudéis en echar un vistazo al vídeo explicativo que nos ofrece Intel:

De las 3 ‘V’ a las 5 ‘V’ del Big Data

Una vez definido lo que es el Big Data y como consecuencia directa de su definición, Doug Laney, un importante analista, definió las famosas 3 ‘V’ de los volúmenes de datos:

Volumen: Concepto que alude al torrente de datos desestructurados que guardan un inmenso potencial en sí mismos, teniendo en cuenta además que lo que hoy es grande, mañana será pequeño, de ahí la temporal relatividad del volumen.
Velocidad: El tiempo de procesamiento de la información es un factor fundamental para que el tratamiento de los datos aporte ventajas que marquen la diferencia, pues los datos también tendrán caducidad temporal.
Variedad: Cuanto mayor es la variedad de los datos, más enriquecedoras serán las conclusiones que podamos sacar. Pero esto también eleva la complejidad del análisis.

Poco a poco, la comunidad fue ampliando estos conceptos, pudiendo llegar a aceptar ya hasta 5 ‘V’, incluyendo las dos siguientes:

Veracidad: Hablamos de datos y datos, pero si no tenemos la autenticidad de éstos y su veracidad, de poco pueden servir sus conclusiones.
Valor: No es precisamente económico poner en marcha las infraestructuras informáticas para almacenar estas cantidades de datos, por lo que las empresas necesitarán que los datos tengan un valor que permita costear su gasto y rentabilizarlo.

¿Personas o datos?

El Big Data supone un nuevo paradigma para el conocimiento: una concepción sobre el uso de datos que nos debe interesar, ya que hoy en día todos somos fábricas de información. Y precisamente esta información puede ser reveladora sobre cuestiones que nos ayuden en el día a día, o puede eliminar al usuario de todo tipo de privacidad. Por eso, las personas nos hemos convertido en un rastro continuo de datos: el banco conoce nuestras transacciones, el supermercado sabe nuestros hábitos de consumo, las redes sociales saben casi hasta cuándo vamos al baño… Es decir, generamos una cantidad astronómica de datos que son almacenables, a pesar de ser muchos de ellos efímeros.

Además, empresas como Google nos han demostrado que la estadística muestra una muy buena precisión, incluyendo además la aleatoriedad de los datos que se recogen (especialmente con ésta), con ejemplos como el que lanzaron en 2006, cuando para la traducción de páginas utilizaban todo el contenido global de Internet.

Esto lleva a las empresas a saber comprender, gracias a estos datos, el perfil, las necesidades y el sentir de sus clientes respecto a determinados productos y servicios. Al final, todo deriva en que el Big Data se convierte en una oportunidad de negocio, donde adquiere especial el cliente final y la forma en que éstos interactúan con la empresa.

Y aun más cuando tenemos un aspecto muy trascendente: los futuribles. Poder aplicar la probabilidad sobre eventos futuros trae un valor a las empresas difícil de imaginar.

Todo esto nos lleva a que al final, toda la información que cada usuario facilita sin casi darse cuenta, está siendo utilizada por grandes empresas para hacer negocio y poder modificar sus productos y servicios en base a la demanda del usuario. Por eso, al final los datos tienen un precio, y si las personas no somos más que simples datos, podríamos concluir que para las empresas, las personas tienen un precio.

Quizá de ahí entendamos por ejemplo el valor que empresas como WhatsApp suponen para quien la compró (Facebook). Y es que aunque no puedan leer nuestros mensajes, saber la cantidad que se envían y quién lo envía ofrece mucha información.

Las ventajas del Big Data

Para Javier Martínez, Director Técnico de NetApp para España y Portugal:

“El negocio de los servidores y del almacenamiento masivo tiene multitud de beneficios que ofrecer a las empresas, facilitando el trabajo o reduciendo los costes, por ejemplo. Esa posibilidad de poder trabajar sin necesidad de pisar la oficina está cada vez más presente. El acceso remoto a cualquier información que podamos necesitar sin importar cuánto de lejos estemos de la oficina ofrece un grado de libertad y movilidad hasta hace poco impensables. Facilita, a fin de cuentas, la continuidad de negocio.”

Esto permitiría a las empresas un aprovechamiento más directo de la información a nivel de negocio, lo cual deriva en beneficios económicos, que es, al fin y al cabo, el destino final de la mayoría de las empresas.

Entre sus ventajas tendríamos la gran evolución y posibilidades que plantean los almacenamientos en la nube, la interconectividad de todos los usuarios, compras online… Prácticamente el poder vivir a través de Internet. O incluso a evolucionar la sociedad, por ejemplo en mejoras de predicción de atascos o aviso de accidentes, entre otras cosas.

Los inconvenientes del Big Data: la privacidad

Pero, ¿es todo tan perfecto? Par ver que no es así, podríamos plantearnos una serie de preguntas:

¿Son realmente válidas las conclusiones? Podríamos correlacionar datos entre aspectos que no tienen conexión alguna, pero que los datos hablan por sí solos. Un ejemplo sería ver cómo los casos de autismo se relacionan con la venta de alimentos orgánicos, pero ¿realmente tienen dicha relación?

¿Puede el análisis de datos reemplazar la investigación científica?

¿Las personas cambiarán a la hora de ofrecer determinados datos? Por ejemplo, un usuario no escribe igual al hacer una búsqueda en Google que al escribir un documento real. ¿Cómo sabemos discriminar el lenguaje correcto?

¿Un análisis de datos con éxito conlleva que el resto deban acabar en éxito? Realmente no podemos saber cuándo un análisis ha dado resultados satisfactorios o no, hasta que con el tiempo podemos comprobar por ejemplo si la predicción fue acertada o no.

¿Podríamos entrar en un ciclo infinito de análisis de datos? Por ejemplo, Google Translate se basa en la web para traducir los textos, pero ¿y si los usuarios, a su vez, crean contenido basándose en Google Translate?

¿Encontrar correlaciones podría bastar con seguir intentando el muestreo de datos?

¿Realmente es todo cuantificable en datos?

Éstas son algunas preguntas que podríamos plantearnos para encontrar posibles inconvenientes en el uso del Big Data. Como era de esperar, no todo podía ser perfecto.

Pero aun así, hay algo mucho mayor que tener en cuenta: la privacidad. La llegada del Big Data debía traer un precio que pagar. Tras haber entendido que nosotros somos, finalmente, un producto y que se comercializa con nuestros datos, toca pensar en qué ocurre con ellos.

Sin embargo, todo esto podría tener una solución, tal como Javier Martínez nos sugiere:

«El uso ético y legal de la información tendrá que ser regulada por las autoridades pertinentes. El análisis de toda la información que generamos, ya sea en las redes sociales, en nuestros dispositivos móviles, o en nuestras cuentas de correo, puede ser útil para nosotros mismos, pero se debe garantizar el consentimiento y el uso lícito de estos datos. Por eso, en el escenario actual, con un modelo cloud y la movilidad como pieza esencial de los negocios, es el momento de conocer las amenazas de antemano, motivo que explica por qué los líderes de seguridad están apostando por un modelo orientado a la inteligencia»

Es decir, caminamos hacia una sociedad donde cada vez estamos más interconectados e identificados casi las 24 horas, generando datos que esconden nuestros gustos, intereses, opiniones…En resumen, una información muy valiosa a nivel empresarial e institucional. De ahí que necesitemos una regulación eficaz y seria.

El curioso caso de Snowden

Por todos es de sobra conocido el caso de Edward Joseph Snowden, consultor tecnológico estadounidense, informante y antiguo empleado de la CIA y de la NSA, el cual en junio de 2013 hizo públicos, a través de The Guardian y The Washington Post, documentos clasificados como alto secreto sobre varios programas de la NSA, incluyendo los programas de vigilancia masiva PRISM y XKeyscore.

El primero de ellos, PRISM, era el programa norteamericano que durante años estuvo espiando correos electrónicos de miles de usuarios con la única finalidad de combatir el terrorismo. Sin embargo, esto no podía vivir en la conciencia de Snowden, pues creía que el gobierno de Estados Unidos destruía la privacidad, la libertad en Internet y las libertades básicas de la gente de todo el mundo.

Por ello, decidió además permitir que se hiciera pública su identidad, alegando que no había hecho nada malo. Sin embargo, para el Departamento de Justicia de Estados Unidos, esta filtración se clasificó como asunto criminal y considerado por muchos americanos como un traidor. Por ello, no tuvo más remedio que encontrar asilo temporal en Rusia, tras estar más de un mes en un aeropuerto, sin la posibilidad de volver a su país, al menos por el momento, hasta que sepa cómo gestionar el caso con el gobierno de los Estados Unidos. Además, no ha escondido su predisposición a buscar asilo político en un país que comparta sus valores. La lista de países a las que Snowden ha pedido tal asilo es larga, entre las que se incluyen España.

Este interesante caso nos vuelve a mostrar el caso de la privacidad de los datos, donde la sociedad debería ser capaz de definir hasta qué punto es lícito la recopilación de datos. Pero sobre todo, quién tiene acceso a esos datos y cómo se regula dicho acceso.

El móvil, el gran aliado del Big Data

Pero, ¿ci hay un dispositivo que se convierte en la llave hacia el Big Data, éste es el móvil. Se trata del dispositivo con más información personal: agenda, fotos, redes sociales, música, GPS… Además de nuestro punto más inmediato de acceso a Internet.

Pero podríamos ir un paso más allá: ¿os suena la película Minority Report o conocéis la novela El Gran Hermano de Orwell? Pues bien, investigadores de la universidad de Birmingham presentaron un algoritmo con el que es posible predecir delitos gracias a la monitorización de los teléfonos móviles. Sí, todo un avance, pero… ¿no empieza esto a asustar?

Lo que parecía convertirse en un avance tecnológico, también tiene pinta de poder acabar en un thriller de Hollywood, donde los espías ya no llevan prismáticos. De hecho, a continuación os mostramos un interesante vídeo sobre cómo los móviles y los datos que manejan:

Debemos, por tanto, tener mucho cuidado con qué datos ofrecemos y a quién. Para ello, nunca estaría de más entender como las grandes empresas utilizan los datos que recopilan. En el caso de Android, podríamos echar un vistazo a la política de privacidad de Google. A partir de ahí, el sentido común, el ser precavidos con nuestros datos. Pero ello no evitará que aun así recopilen datos sobre nosotros. Ahí es donde deben entrar en juego las autoridades para regular coherentemente dicha recopilación. Tras todo esto, os volvemos a plantear la pregunta inicial: ¿Es el Big Data un monstruo?