Tasa de tipos/tokens
La tasa de tipos/tokens (TTR) es la relación entre el número de palabras únicas que aparecen en un texto y sus frecuencias. El número de palabras únicas en un texto se denomina frecuentemente número de tokens. Varios de estos tokens se repiten.
- La tasa de tipos/tokens puede variar entre 0 y 1.
- Cuantos más tipos existen en comparación con el número de tokens (cuanto mayor es el valor), más variado es el vocabulario. Esto significa que hay una mayor variedad léxica en el texto.
La tasa de tipos/tokens se calcula de la siguiente manera:
Tasa de tipos/tokens = (número de tipos / número de tokens) * 100
En las listas de palabras y las nubes de palabras, la tasa de tipos/tokens se muestra en la barra de estado situada en la parte inferior.
La tasa de tipos/tokens (TTR) varía considerablemente en función de la longitud del texto — o corpus de textos — que se está estudiando. Un artículo de 1.000 palabras podría tener una TTR del 40%; uno más corto podría alcanzar el 70%; 4 millones de palabras probablemente darán una tasa de tipos/tokens de aproximadamente el 2%.