365 relatos de la Inteligencia Artificial

365 relatos de la Inteligencia Artificial

Palabras con peso: cómo una idea de 1972 se convirtió en la brújula de la inteligencia artificial textual

19 de julio de 2025

Avatar de 365 Relatos de la IA
365 Relatos de la IA
jul 19, 2025
∙ De pago
Generada con IA - Substack

En 1972, Karen Spärck Jones propuso que no todas las palabras son iguales. Algunas, como “tecnología” o “seguro”, aparecen en todos los textos y dicen poco; otras, más raras, revelan el tema central de un documento. Aquella intuición se transformó en el índice de frecuencia inversa (IDF), la fórmula silenciosa que hoy guía a buscadores, resúmenes automáticos y modelos de lenguaje.

A comienzos de los años setenta, la informática aún estaba lejos de comprender el lenguaje humano. Los ordenadores podían almacenar texto, pero no sabían interpretarlo. El gran desafío era cómo distinguir los documentos relevantes en una colección cada vez mayor de información digital. En ese contexto, la lingüista computacional Karen Spärck Jones introdujo un concepto brillante por su simplicidad: si una palabra aparece en muchos documentos, es menos útil para distinguir uno de otro; si aparece en pocos, probablemente sea clave para identificar su contenido. Así nació el IDF —Inverse Document Frequency—, una métrica que asigna más peso a los términos raros que a los frecuentes.

Avatar de User

Continúa leyendo este Post gratis, cortesía de 365 Relatos de la IA.

O compra una suscripción de pago.
© 2026 365 Relatos de la IA · Privacidad ∙ Términos ∙ Aviso de recolección
Crea tu SubstackDescargar la app
Substack es el hogar de la gran cultura