El valor de los datos

(Para giorgio tosi)

16/02/22

Es bien sabido que en Internet hay una gran cantidad de datos de diferentes tipos y fuentes. Datos que generalmente están disponibles para su consulta a través de aquellos navegadores que nos permiten interactuar con la red de formas que solo pueden ser textuales (leyendo un artículo, por ejemplo) o incluso multimedia (audio, video y streaming).

Por tanto, parece que todos estos datos están al alcance de cualquiera y pueden utilizarse para extraer información que nos ayude a orientar nuestras elecciones en la vida diaria.

En realidad, las cosas no son tan transparentes y simples. De hecho, los métodos de uso de estos datos están diseñados para la interactividad que distingue la relación Hombre-Máquina. Las dificultades surgen cuando se quiere reutilizar estos datos para tratarlos de forma personal para extraer información de interés específico para el usuario individual.

Para aclarar, nos referimos al caso de los precios de las acciones de cualquier mercado (Borsa Italiana, Nyse o Nasdaq…): existen multitud de sitios que permiten el análisis de la evolución de una acción (TICKER) y proporcionan un conjunto serie de datos relacionados el valor, las cantidades manejadas, los máximos y mínimos diarios, etc. La interfaz de estos datos es, como se ha dicho, la típica de la interacción Hombre-Máquina: el navegador.

Si quisiera procesar estos datos localmente para extraer información de mi interés, las cosas se complican significativamente. Para acceder a esos mismos datos desde una interfaz programática, hay 2 métodos disponibles: el web scraping o acceder a través de una interfaz de datos específica como API REST (transferencia de estado representacional) o SOAP (Protocolo simple de acceso a objetos), donde REST es, con mucho, la solución más extendida y utilizada.

Analicemos brevemente las dos alternativas. El web scraping se basa en la emulación del comportamiento humano al transferir la página web de interés al cliente y luego intervenir en ella en busca de los datos de interés mediante la identificación de un patrón reconocimiento conocido. Por ejemplo, usar etiquetas HTML particulares que le permitan identificar los datos de interés para la intención de la página HTML.

Aunque se dispone de bibliotecas en varios lenguajes de programación (JavaScript, Python, Java,...) que de alguna manera facilitan la identificación y reconocimiento de los datos particulares, el procedimiento no es inmediato y es propenso a errores. Además, si la página HTML de origen cambia, es posible que la guión desarrollado es incorrecto porque el patrón reconocimiento (por ejemplo, la etiqueta que identifica los datos ha cambiado) esta solución, por lo tanto, aunque posible, puede ser problemática debido a la complejidad de implementación y la estricta dependencia de la estructura de la página HTML.

La solución basada en una interfaz programática API REST (o SOAP) es absolutamente más robusta y fácil de implementar.

La tarea de estas interfaces es estandarizar los métodos de acceso a los datos. En el caso de las interfaces REST, por lo tanto, se utilizará la tecnología HTTP y los datos solicitados se leerán a través de GET en URL específicas construidas de tal manera que identifiquen de manera única los datos de interés.

Como ejemplo, informo la URL para acceder a la interfaz REST del servicio de conversión de moneda proporcionado por el Banco de Italia.

https: //tassidicambio.bancaditalia.it/terzevalute-wf-web/rest/v1.0/dailyRates?referenceDate= {datos} & baseCurrencyIsoCode = {de} ¤cyIsoCode = {tto} & idioma = {“eso"}

Los términos en negrita se utilizan para definir las monedas involucradas y la fecha de valoración del índice de conversión. Una operación GET en esa URL devolverá el valor buscado. Esta operación se puede implementar fácilmente desde cualquier lenguaje de programación (Python, Javascript, C#,…) mediante el uso de librerías adecuadas.

Aunque existen muchos servicios gratuitos basados en este tipo de interfaz, es interesante notar que hay muchos sitios que ofrecen información financiera a cambio de una tarifa. Suelen ser datos especialmente detallados que ofrecen una visión completa de aspectos relacionados con la información financiera relativa a mercados y empresas de todo el mundo. Quisiera subrayar que muchos de estos sitios, en particular los relacionados con aspectos económicos y financieros, ofrecen acceso completo solo mediante alguna forma de suscripción.

Básicamente, el uso de datos a través de una interfaz programática está sujeto a un pago. Lo que ayuda a reforzar un concepto básico que muchas veces se pasa por alto: en Internet, el valor real está en los datos. Si los datos agregados y utilizables, pero aún públicos, de las empresas cotizadas tienen un valor específico y son objeto de ofertas de suscripción, podemos imaginar qué valor tienen nuestros datos personales que, más o menos a sabiendas, hemos entregado a multitud de empresas. que gestionen sitios de comercio electrónico o redes sociales.

_Referencias

_{Uno de los muchos sitios que ofrecen información financiera por suscripción. https://site.financialmodelingprep.com/developer/docs/pricing}

_{Profundizando en la interfaz REST https://www.ibm.com/cloud/learn/rest-apis}