Ciencia de los datos (primera parte)

Ciencia de los datos (primera parte)

En la era de los datos masivos, todo se vuelve dato, menciona Guzmán en la charla presentada en el día mundial de la estadística, el año 2014 con el título “El rol de la estadística en un mundo hiperconectado”, además señala que la producción de los datos aumenta exponencialmente. Cada vez el mundo está más lleno de datos, y cada vez se tiene más acceso a éstos, aunque aún la mayor parte de la información producida no está al alcance de las personas o no es útil. Cada una de las personas cercanas, en cualquier lugar que otra persona se encuentre, tiene un teléfono celular, el que aun sin usarlo está produciendo datos sobre su ubicación, sobre mensajes y llamadas recibidas. Cada vez que se navega en Internet se está produciendo datos sobre conductas, preferencias, etc. Cuando se pasa cerca de una cámara, o cuando se utiliza una cámara para tomar fotos, se está produciendo datos o se está ayudando a producirlos. Cuando se compra, cuando se pone un “me gusta” en Facebook, se está creando datos. Pero no se genera un dato aislado. Cada “me gusta” está asociado con las características de quien lo puso. De este modo, el dato se convierte en la covariable de otro dato. Datos que están concatenados a otros datos y que hablan de los gustos, ambiciones, temores, celebraciones, y otros aspectos de la vida de las personas, incluso algunos que pueden ser bastante íntimos.

Por su parte, en las noticias publicadas por el portal de universidades españolas “Universia”, específicamente la publicada en junio del año 2014 con el título “El científico de datos: Una novedosa y necesaria profesión”, se menciona que a diario en el mundo se generan dos trillones y medio de bytes de información. Esta información proviene de todos lados, sensores que recogen información climática, publicaciones en las redes sociales, imágenes y vídeos digitales, registros de compra y transacciones y señales de los sistemas de posicionamiento global de los dispositivos móviles, entre otros. Toda esta información se conoce como “datos grandes” y es a partir de esta fuente masiva de datos que es inminente el nacimiento de un profesional que conozca y genere un uso a esta información: el científico de datos.

El profesor Hal Varian de la Universidad de Berkeley en California, en la entrevista publicada el año 2009 por la compañía McKinsey, menciona que la profesión del futuro seria la que tuviera la habilidad de hacer posible que los datos fueran comprendidos, de ser procesados, de extraerles valor, de visualizarlos, de comunicarlos, todo lo cual será una tarea tremendamente importante en las décadas siguientes. Y no solamente para el profesional sino también para la educación en sus distintos niveles, desde la enseñanza primaria a la enseñanza universitaria. Y esto porque se dispone de datos libres y ubicuos. Añadió tambien que la consecuencia era entender el significado de los datos y extraer su valor. El profesor Varian, en la obra citada, siguió explicando que la ciencia de los datos era como una disciplina estadística, pero señalando que hay más que el puro numero aislado, que la tarea esencial es de visualización, comunicación y utilización de los datos. La estadística es parte de ello, pero solo una parte. También se desea ser capaz de visualizar los datos, comunicarlos, utilizarlos de manera efectiva. También opinaba que estas capacidades de acceder, entender y comunicar el conocimiento que se puede obtener del análisis de los datos, seria de extrema importancia para que los gestores y directivos de las organizaciones, de las empresas e instituciones, puedan acceder y comprender los datos directamente ellos mismos.

En el artículo publicado el año 2014 con el titulo “La ciencia de los datos y el conocimiento en la empresa”, Fernando Piera menciona que la capacidad de improvisar soluciones de integración de datos utilizando sistemas operativos, bases de datos y lenguajes de programación distingue claramente la ciencia de los datos de la tradicional investigación estadística. En el mismo artículo cita al bioestadístico Michael Elashoff, quien alude que el término “científico de datos” es realmente más que un reconocimiento a la gente de este campo que necesita múltiples tipos de conocimientos. Reconoce el hecho de que la observación de los datos requiere más que habilidades analíticas. La función del científico de los datos es hacer que los datos tengan sentido, facilitar una comprensión clara del universo de la organización a través del análisis de los datos, ayudando en la mejora del proceso de toma de decisiones y apoyando al liderazgo. Los mejores científicos de los datos también deben interesarse por el descubrimiento de nuevas visiones de los datos. Serán creativos en su aproximación a la identificación y resolución de problemas. La experiencia profesional de estos científicos se encuentra en los siguientes tres pilares: (1) Profundo conocimiento teórico de estadística y conmutabilidad; (2) Conocimiento práctico de variadas herramientas de ciencia de los datos y la capacidad de comunicar efectivamente cuando es necesario; (3) Una capacidad para comunicar de manera efectiva con la gente que no tenga conocimientos técnicos sobre temas técnicos muy complejos. Pueden utilizar un surtido variado de las herramientas existentes de análisis de datos y también tener el conocimiento estadístico y habilidades de programación necesarias para desarrollar sus propias herramientas. Muchos problemas de análisis pueden ser resueltos utilizando las herramientas existentes, pero el científico de los datos también debe estar en condiciones de desarrollar las herramientas que necesite para atacar nuevos problemas que se le puedan plantear.

 

Guillermo Choque Aspiazu
www.eldiario.net
11 de Mayo de 2015

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Translate »