Al defender Big Data del argumento “es más de lo mismo”, algunos han tratado de tomar una visión general de Big Data diciendo que va a revolucionar el método científico. En resumen: no pierdas el tiempo en teorías e hipótesis, solo mira lo que te dicen los datos. Este es el tipo de publicidad sobre Wired Magazine demasiado simplificada que fue derribada incluso antes de la locura de Big Data, al señalar la cantidad de patrones falsos que estos métodos “descubren”.
Sin embargo, lo que no se informa es que alguien intentó algo muy similar a Big Data hace décadas. Y fallaron .
“Ellos” eran la organización británica de observación masiva, que desde 1937 trató de grabar lo más posible sobre las actividades ordinarias de la gente común. Sus conversaciones, horarios de trabajo y juego, anécdotas, charlas, opiniones. Justo el tipo de datos que Facebook, Twitter y otros están engullendo en masa hoy.
Como señaló P. G Medawar en un discurso en 1964, la organización estaba motivada por la gran pregunta de deducción vs inducción en la ciencia. La deducción es cuando tienes una teoría, algunos axiomas y deduces algo de ellos. Como usar la teoría de la relatividad de Einsteins para deducir cómo se comporta un agujero negro, por ejemplo. Sus deducciones son ciertas dado que la teoría con la que comenzó era correcta, como una prueba matemática. Si bien esto puede conducir a descubrimientos, nunca puede revelar nada que no estuviera realmente presente en la teoría desde el principio, por lo que está limitado en lo que nos puede decir sobre el mundo real.
- ¿Goldman paga menos que sus competidores?
- Cómo decidir cuánto pagarme como salario si dirijo un negocio unipersonal
- ¿Qué hace un asesor de juegos de GameStop? ¿Cuánto ganan?
- ¿Cuál es el sueldo de un italiano?
- ¿Puedes sobrevivir en Zurich, Suiza con un salario anual de 36,000 CHF?
El razonamiento inductivo, por otro lado, es cuando se argumenta a partir de observaciones del mundo real, haciendo afirmaciones que probablemente sean ciertas. Es menos seguro, pero podría revelar cosas no mencionadas en su teoría. Este es también un gran reclamo de Big Data, que puede avanzar nuestro conocimiento al descubrir patrones en los datos del mundo real y hacer proposiciones y predicciones al respecto. Lejos de ser una idea revolucionaria sobre la ciencia, en realidad está repitiendo la convicción de John Stuart Mill (1806-1873), un influyente filósofo británico que sostenía que el razonamiento inductivo era el verdadero camino de la ciencia.
La organización de observación masiva tomó su palabra y trató de aplicar la inducción a la investigación social. A través de 500 informantes voluntarios no capacitados, registraron la vida cotidiana en Gran Bretaña desde 1937 hasta los años 60. Al igual que las estadísticas de Twitter sobre el sentimiento y los “temas de tendencia” en torno a los principales eventos, Mass-Observation capturó el sentimiento de los británicos comunes el 12 de mayo de 1937, el día de la coronación del rey Jorge VI. Durante la Segunda Guerra Mundial, sus estadísticas sobre hábitos de ahorro influyeron en la política fiscal. La observación masiva también ayudó a dar forma a los carteles de propaganda del Ministerio de Información, de forma similar a cómo una empresa hoy podría modificar su campaña publicitaria en función de las reacciones mineras en las redes sociales. Los problemas de privacidad fueron tan grandes o más grandes con la observación masiva como lo son hoy en día, con los informantes contando los argumentos y la vida amorosa de sus vecinos.
Si bien de alto perfil y exitoso, las repetidas críticas a la validez de sus métodos parecen haberlos desvanecido, hasta que la Observación masiva finalmente se cerró, siendo absorbida por una compañía de publicidad menos ambiciosa. Al igual que los prolíficos carteles de Twitter, sus informantes no eran una muestra representativa de la población. Tampoco se materializaron las promesas del ingenuo razonamiento inductivo. En palabras de Medawar:
Las creencias que subyacen a la observación masiva aparentemente fueron las siguientes: que si
uno solo podía registrar y establecer los hechos crudos reales sobre lo que las personas hacen y lo que dicen en pubs, en trenes, cuando se hacen el amor, cuando juegan, etc., de alguna manera, de esta riqueza de información, inevitablemente surgiría una gran generalización.
Bueno, de hecho, nada importante surgió de este enfoque, a menos que alguien me haya estado ocultando. Creo que los pioneros de la observación masiva fueron ornitólogos. Ciertamente observaban a los hombres, aplicaban a la sociología los mismos métodos que habían hecho tanto para desacreditar a la ornitología. [1]
Casi cincuenta años después del discurso de Medawar, es como escucharlo reprender a los evangelistas de Big Data. En el panorama general, del libro de 1843 de Mill A System of Logic En el último punto de venta en un piso de exhibición abarrotado, hay un péndulo que oscila entre el razonamiento inductivo y deductivo y simplemente nos dirigimos hacia el extremo inductivo en este momento.
[1] \ Medawar, PB ¿El artículo científico es un fraude? Experimento: una serie de casos científicos