Relación tipo-término

La relación tipo-toque (TTR) es la relación entre el número de palabras únicas que aparecen en un texto y sus frecuencias. El número de palabras únicas en un texto suele denominarse número de tokens. Varios de estos tokens se repiten.

  • La relación tipo-token puede variar entre 0 y 1.
  • Cuantos más tipos haya en comparación con el número de tokens (cuanto mayor sea el valor), más variado será el vocabulario. Esto significa que hay mayor variedad léxica en el texto.

La relación tipo-token se calcula del siguiente modo:

Relación tipo/token = (número de tipos/número de tokens) * 100

En las listas y nubes de palabras, la relación entre el tipo y el número de palabras se busca en la barra de estado de la parte inferior.

La relación tipo/fichas (TTR) varía mucho en función de la longitud del texto -o corpus de textos- que se estudia. Un artículo de 1.000 palabras puede tener un TTR del 40%; uno más corto puede alcanzar el 70%; 4 millones de palabras darán probablemente un ratio tipo/token de alrededor del 2%.