Introducción
En este blog mostramos la utilidad de usar las herramientas Google Ngrams y ChatGPT-4 para realizar sencillos estudios sobre la presencia de las plagas en la literatura del siglo XX de diversos países del mundo, y encontrar posibles explicaciones socioeconómicas que justifiquen dichas tendencias.
Por simplicidad, en este trabajo hemos utilizado únicamente las chinches como plaga objetivo en la literatura de Europa y Estados Unidos, limitándonos a un periodo temporal entre 1919 y 2019.
Asimismo, con el objetivo de facilitar que otras personas puedan repetir este trabajo, extenderlo o realizar otros análisis diferentes, hemos desarrollado un pequeño código en el lenguaje de programación Python, que permite extraer datos directamente de Ngrams, procesarlos, pintarlos y salvarlos de forma local en el ordenador de cada persona.
Los resultados obtenidos muestran tendencias interesantes en relación a la presencia de las chinches a lo largo del tiempo. En particular, para el caso de Europa, se observan 3 periodos cíclicos continuos de incrementos y decrementos entre 1919 y 1970, un periodo plano de mínima presencia entre 1970 y 2010, y un último periodo actual de gran crecimiento entre 2010 y 2019.
Para el caso de la literatura de los Estados Unidos, se observa un comportamiento diferente al europeo. Con excepción de 2 periodos (i.e., un pico entorno a 1945 y un periodo de crecimiento continuado desde 1995), la tendencia en Estados Unidos es a una continua disminución del término desde su máximo en 1945, con un rebrote a partir de los años 1990. Ambas tendencias (EU y USA) muestran un crecimiento continuo desde el año 2000 hasta la actualidad.
Según ChatGPT4, entre las temáticas que podrían explicar las tendencias observadas, destacarían la Gran Depresión económica y los años posteriores a la 2ª Guerra Mundial, el desarrollo urbanístico, el uso/restricción de los pesticidas DDT, la globalización de los mercados y el auge del turismo internacional.
El código, los datos y los gráficos mostrados en este trabajo pueden descargarse desde el siguiente enlace: enlace
Extracción y Análisis con Google Ngrams
Google Ngrams es una herramienta digital, que forma parte de Google Books, que permite a los usuarios analizar la frecuencia de palabras o frases específicas (conocidas como ‘n-grams‘) en más de 30 millones de libros, en varios idiomas, desde 1919 hasta 2019.
En el contexto de la Sanidad Ambiental, esta herramienta puede ser de gran utilidad para conectar la trayectoria histórica del lenguaje y la literatura con nuestra comprensión moderna del control de plagas y campos científicos relacionados. A nuestro parecer, mediante el análisis de las tendencias temporales de varios países y periodos, esta herramienta nos abre una oportunidad de adentrarnos en el pasado, comprender el presente y, tal vez, anticipar tendencias futuras en nuestra lucha continua contra las plagas y las infestaciones.
En este trabajo hemos definido los siguientes elementos de búsqueda:
- Idiomas (corpus): español, italiano, francés e inglés norteamericano. Con el objetivo de observar tendencias generales, y existiendo una limitación real entre el conjunto de todos los idiomas de la Unión Europea disponibles en esta herramienta, hemos definido como “Europa (SIF)” a la combinación de los resultados de las búsquedas en el corpus español, italiano y francés.
- Palabras de búsqueda: chinche y chinches (para el caso español), cimici y cimice (para el caso italiano), punaise y punaises (para el caso francés) y bedbug y bedbugs (para el caso inglés).
- Periodo temporal del análisis: el siglo comprendido entre las fechas 1919 – 2019.
Con el fin de facilitar el uso de esta herramienta de análisis, hemos elaborado un Jupyter Notebook con el que realizar la extracción de las búsquedas, su procesamiento y combinación posterior, su visualización y salvado local de tablas y gráficas, sin necesidad de tener que ejecutar repetidas veces las consultas directamente en la web de Google Ngrams.
En el siguiente gráfico mostramos los resultados obtenidos para el corpus de libros europeos (línea azul) y para el corpus de libros norteamercianos (línea naranja).
Dejamos la discusión para la siguiente sección.

Resultados e interpretaciones con ChatGPT-4
Para realizar un análisis casuístico, de las tendencias observadas en la literatura, hemos usado ChatGPT4 con el plugin de Wikipedia. Asimismo, hemos usado el paquete de Data Analyst para poder proporcionarle directamente el gráfico obtenido que compara las frecuencias entre Europa y Estados Unidos y dejarle que identifique sus propias tendencias. Por otra parte, con el objetivo de optimizar el retorno de la información de ChatGPT4 hemos realizado varios procesos de Priming de los Prompts.
Aunque existe numerosas maneras de abordar el análisis de los resultados obtenidos con Google Ngrams, por razones de simplicidad, en este trabajo hemos optado por definir manualmente un subconjunto de intervalos de tiempo y preguntarle a ChatGPT4 por los eventos socioeconómicos de la época que podrían haber motivado un incremento (decremento) de la presencia de estas plagas en la literatura.
Asimismo, se decide realizar los análisis en tres partes:
- En primer lugar, analizamos el caso de Europa (SIF) con sus intervalos específicos. Prestamos especial atención a los procesos cíclicos de incrementos y descensos entre 1919 y 1970, un periodo plano de mínima presencia entre 1970 y 2010, y un último periodo de gran crecimiento entre 2010 y 2019.
- Posteriormente, analizamos el caso de los Estados Unidos con una definición de intervalos diferente. En particular, nos centramos en el incremento entre 1935 – 1945, el descenso continuo hasta 2000 y el incremento progresivo desde entonces hasta hoy.
- Finalmente, le pedimos a ChatGPT4 que saque unas conclusiones generales, comparativas y libres (sin periodos fijos) entre ambas tendencias.
Advertencia: es importante evitar asumir un aumento de las menciones de una palabra en la literatura (ej., “chinche” en nuestro caso), como la respuesta directa del aumento de la presencia de la plaga en la sociedad. Aunque es cierto que se puede pensar en casos en los que un problema de plagas podría reflejarse en la literatura de la época, otras cuestiones técnicas asociadas con su tratamiento, como el uso o prohibición de pesticidas, podrían generar también un efecto similar.
1. EUROPA (SIF: Spain, Italy and France)
Periodo [1919 – 1935]:
- Recuperación Post-Primera Guerra Mundial (1919-1924): Tras la Primera Guerra Mundial, Europa estaba en un período de recuperación. La devastación dejada por la guerra llevó a condiciones de vida pobres y hacinamiento, especialmente en centros urbanos donde la gente buscaba trabajo y reconstruía sus vidas. Esto podría haber proporcionado un ambiente ideal para las infestaciones de chinches.
- Los Años Locos (1925): El pico en 1925 podría atribuirse al auge económico y la urbanización, conocidos como los Años Locos. El aumento de los viajes, tanto domésticos como internacionales, podría haber contribuido a la propagación de las chinches.
- Inicio de la Gran Depresión (1929-1935): El inicio de la Gran Depresión a finales de la década de 1920 habría mantenido o aumentado inicialmente la prevalencia de las chinches debido a la pobreza y el hacinamiento. Sin embargo, a medida que la depresión empeoraba, podría haber habido menos viajes y reducción de la migración urbana, llevando a una disminución en las infestaciones de chinches reportadas en la literatura.
Periodo [1935 – 1950]:
- Pre-Segunda Guerra Mundial y Segunda Guerra Mundial (1935-1945): El aumento hasta 1940 podría estar relacionado con la movilización para la guerra, que habría causado hacinamiento en barracones militares y movimientos de refugiados, contribuyendo a las infestaciones de chinches. Durante la guerra, las cadenas de suministro interrumpidas y el acceso limitado a pesticidas efectivos podrían haber exacerbado el problema.
- Recuperación Post-Segunda Guerra Mundial (1945-1950): La disminución después de 1945 podría reflejar los esfuerzos para reconstruir y modernizar Europa. La introducción y uso generalizado de pesticidas sintéticos, incluyendo el DDT, probablemente llevó a una disminución en las poblaciones de chinches.
Periodo [1950 – 1970]:
- Auge Post-Guerra (1950-1960): El aumento hasta 1960 podría asociarse con el auge económico y el incremento de los viajes. La reconstrucción de viviendas urbanas podría no haber eliminado inmediatamente los hábitats de las chinches, llevando a un aumento temporal.
- Uso de Pesticidas y Estabilización Económica (1960-1970): La adopción generalizada de pesticidas modernos y la mejora de los estándares de vida podrían haber llevado a una disminución en las infestaciones de chinches. Además, las mejoras en la salud pública también podrían haber contribuido a mejores medidas de control de plagas.
Periodo [1970 – 2010]:
- Regulación de Pesticidas (a partir de los 1970s): La planitud de este período sugiere que las infestaciones de chinches podrían haberse mantenido a raya debido a la efectividad de las medidas de control de plagas y las condiciones de vida urbanas estables.
- Conciencia Ambiental (1980s-1990s): El aumento de la conciencia ambiental y regulaciones más estrictas sobre pesticidas como el DDT podrían haber prevenido un resurgimiento en las poblaciones de chinches, a pesar de que estos pesticidas se estaban eliminando gradualmente.
Periodo [2010 – 2019]:
- Globalización y Viajes (a partir de 2010): El aumento sin precedentes puede atribuirse a la explosión de viajes internacionales, contribuyendo a la propagación de las chinches a través de las fronteras.
- Resistencia a Pesticidas (a partir de 2010): Las chinches han desarrollado resistencia a muchos de los pesticidas comúnmente utilizados, lo que ha llevado a un control y erradicación más desafiantes, lo que habría aumentado su presencia en la literatura.
- Densidad Urbana y Alquileres a Corto Plazo (a partir de 2010): El aumento de la densidad urbana y la popularidad de los servicios de alquiler a corto plazo podrían haber facilitado la propagación de las chinches, ya que estos entornos pueden ser más difíciles de regular y controlar en términos de gestión de plagas.
2. ESTADOS UNIDOS
Periodo [1919 – 1935]:
- Post-Primera Guerra Mundial y la Gran Depresión (1919-1935): Durante este tiempo, aunque la urbanización continuó, los avances en la infraestructura y en la higiene pública podrían haber ayudado a mantener las infestaciones de chinches relativamente estables. Además, la Gran Depresión pudo haber limitado el alcance de la literatura centrada en temas como las chinches, ya que otros temas de mayor gravedad económica y social dominaban el discurso público.
Periodo [1935 – 1950]:
- Preparativos y Desarrollo de la Segunda Guerra Mundial (1939-1945): La movilización para la guerra probablemente llevó a un aumento en las infestaciones de chinches, debido a las condiciones de hacinamiento en los alojamientos militares y en las ciudades. El pico en 1945 puede estar relacionado con el regreso de las tropas del extranjero, lo que podría haber llevado a un breve aumento en la propagación de chinches.
- Post-Segunda Guerra Mundial (1945-1950): El rápido descenso después de 1945 puede estar asociado con el uso masivo de DDT y otros pesticidas en los hogares y en entornos urbanos, lo que resultó en una disminución drástica de las poblaciones de chinches.
Periodo [1950 – 1995]:
- Era de los Pesticidas (1950-1970): El uso continuo y generalizado de pesticidas como el DDT probablemente mantuvo las poblaciones de chinches en niveles bajos. Esta era también coincide con una mejora general en los estándares de vida y en la calidad de las viviendas.
- Conciencia Ambiental y Regulación de Pesticidas (1970-1995): A medida que creció la conciencia ambiental y se implementaron regulaciones más estrictas en cuanto al uso de pesticidas, se desarrollaron y aplicaron métodos de control de plagas más seguros y efectivos. Esto pudo haber contribuido al mínimo en 1990, ya que los programas de control de plagas eran eficientes y la conciencia pública sobre la prevención de infestaciones era alta.
Periodo [1995 – 2010]:
- Globalización y Aumento de Viajes (1995-2010): La era de la globalización facilitó el movimiento internacional de personas y bienes, lo que probablemente aumentó la dispersión de chinches. Esto, junto con el creciente tráfico aéreo y la popularidad de los viajes internacionales, podría haber contribuido al resurgimiento de las chinches en la literatura.
- Desarrollo de Resistencia a Pesticidas (1995-2010): A medida que las chinches desarrollaron resistencia a los pesticidas comunes y las regulaciones limitaron el uso de químicos más agresivos, el control de las infestaciones se volvió más complicado. Esto puede haber llevado a un aumento en la conciencia y la cobertura literaria del problema de las chinches.
3. ANÁLISIS COMPARATIVO: EUROPA VS ESTADOS UNIDOS.
- Principios del siglo XX: ambas regiones muestran presencia de chinches en la literatura, probablemente debido a la urbanización y los efectos de la postguerra. Sin embargo, Europa muestra una frecuencia más alta, posiblemente debido al mayor impacto de la Primera Guerra Mundial en las ciudades europeas.
- Mediados del siglo XX: el declive es más pronunciado en Europa, lo que podría reflejar una adopción más inmediata y generalizada de pesticidas como el DDT después de la Segunda Guerra Mundial. EE.UU. también muestra un declive, pero menos pronunciado, quizás debido a diferencias en las tasas de urbanización y estándares de vida.
- Finales del siglo XX a principios del siglo XXI: el resurgimiento es mucho más pronunciado en Europa, lo que puede deberse a regulaciones de pesticidas más estrictas en la UE y a los entornos urbanos densos que facilitan la propagación de chinches. EE.UU. muestra un aumento más gradual, posiblemente debido a una combinación de factores, incluyendo la expansión urbana, los viajes y el desarrollo de la resistencia.
- Los entornos regulatorios, las condiciones socioeconómicas y la sincronización y extensión de la urbanización han influenciado las tendencias en las infestaciones de chinches reflejadas en la literatura. El resurgimiento en el siglo XXI ha sido un problema global, pero es posible que la conciencia y los informes hayan aumentado más rápidamente en Europa, como sugiere la frecuencia literaria.
- Las diferencias en las trayectorias entre Europa y EE.UU. también pueden sugerir variaciones en la conciencia pública, la cobertura mediática y el impacto de los factores socioeconómicos en la percepción y discusión de las chinches en la literatura.
Conclusiones
En este trabajo hemos ilustrado el valor que las herramientas de Inteligencia Artificial Google Ngrams y ChatGPT4 pueden aportar al estudio histórico de las plagas en nuestra sociedad, a través de las trazas que han dejado en la literatura contemporánea.
En el caso de las chinches, hemos observado diferentes tendencias a lo largo de los 100 años de análisis de este trabajo, entre las menciones encontradas en la literatura Europa (definida como la combinación del corpus español, italiano y francés) y la norteamericana.
Aquí dejamos las principales conclusiones obtenidas:
- En Europa observamos una actividad más regular, con procesos cíclicos consecutivos de 10 años de duración, desde comienzos del siglo XX hasta los años 70. Entre 1970 y los años 2000, se observa una estagnación del término, alcanzando valores mínimos entorno a los años 1990. A partir de los años 2010, se observa un rebrote del término que continua en crecimiento hasta la fecha máxima disponible en este trabajo.
- Para Estado Unidos observamos un comportamiento diferente del europeo. Con excepción de 1935–1945, donde se observa el máximo de referencias a este término, la tendencia es a la disminución progresiva de la temática. Al igual que para el caso europeo, se observa un incremento notorio de la presencia del término desde los años 2005.
- Entre las principales temáticas que podrían justificar los incrementos (decrementos) de la presencia de las chinches en la literatura del siglo XX, destacarían la Gran Depresión económica y los años posteriores a la 2ª Guerra Mundial, el desarrollo urbanístico, el uso/restricción de los pesticidas DDT, la globalización de los mercados y el auge del turismo internacional.
Este trabajo podría extenderse a otras plagas, regiones y periodos de tiempo. Asimismo, se podrían realizar estudios de la influencia “entre países” de los términos de búsqueda. En algunas ocasiones, países cercanos como es el caso de España, Italia y Francia, se observan tendencias similares (i.e., aumentos/descensos) desplazadas unos años en el tiempo.
Finalmente, reforzar la idea de que aunque este tipo de herramientas puedan ser valiosas para la investigación y el análisis de tendencias, los datos están influenciados por la diversidad y la naturaleza de los libros en el corpus. Por lo tanto, comprender su contexto y posibles sesgos es crucial para una interpretación precisa. Google Ngrams es especialmente relevante para expertos en varios campos, ofreciendo una perspectiva única sobre cómo han evolucionado los temas en la literatura y el discurso público.