Ferramentas relacionadas
Por que usar estatísticas de texto?
Veja se as frases ficam longas demais, se as palavras são incomuns em comprimento ou quão variado parece o léxico — antes de NLP pesado ou de enviar a um editor.
Benefícios
- Médias: comprimento médio de palavra e frase de relance.
- Extremos: detetar valores atípicos de comprimento.
- Riqueza: percentagem simples únicos face ao total.
- Ao vivo: métricas atualizam enquanto escreve.
- Privado: só no cliente, sem servidor.
Como funciona
Divisões e aritmética em JavaScript — adequadas a texto simples parecido com inglês, não substituem ferramentas linguísticas.
O que mostra
- Palavras: `trim` e depois divisão por espaço em branco.
- Frases: divisão em . ! ? e remove segmentos vazios.
- Palavra mais longa/curta: pelo comprimento bruto do token.
- Frase mais longa/curta: pela contagem de palavras em cada segmento.
- Riqueza: tamanho do `Set` de formas normalizadas sobre contagem de tokens.
Quando usar
Revisão de rascunhos, trabalhos de estudantes, newsletters e comparações rápidas entre duas versões coladas.
Casos de uso ideais
- Edição: apanhar uma frase gigante.
- Estilo: ver se médias mudam entre secções.
- Ensino: demonstrar métricas simples.
- QA: antes de pontuações de legibilidade especializadas.
- Privacidade: rascunhos pensados para offline primeiro.
Factos
Limitações importantes.
Pontos-chave
- O comprimento médio de frase usa contagem simples de frases; divisões vazias são filtradas.
- A frase mais longa na UI pode truncar após 100 caracteres por layout.
- Palavras hifenizadas e contrações contam como um token.
- Scripts não latinos podem afetar a normalização do conjunto de riqueza.
- Colagens muito grandes podem atingir limites de memória do navegador.
Boas práticas
Use com critério.
Qualidade
- Combine com ferramenta de legibilidade para notas graduadas.
- Em contagens legais ou académicas, siga a definição oficial de «palavra».
- Limpe marcação para texto simples primeiro para métricas justas.
- Compare rascunhos com a mesma higiene de colagem.
- Não trate a riqueza como único sinal de qualidade SEO.
Quando não confiar
- Quando limites de frase devem coincidir com o guia da editora.
- Quando precisa de estatísticas de sílabas, lemas ou n-gramas.
- Como substituto de suites de plágio ou SEO.
Limitações e compatibilidade
Métricas heurísticas; entrada em área de texto simples; requer JavaScript.
Alimentado por processamento no lado do cliente.
Perguntas frequentes
A ferramenta de estatísticas de texto é gratuita?
Sim. A análise corre no seu navegador. Não é preciso registar-se nem enviar o texto a um servidor.
O que significa riqueza do vocabulário aqui?
Formas de palavra únicas (minúsculas; removidos caracteres não alfanuméricos da chave) divididas pelo total de palavras, vezes 100. É uma proporção tipo–token simples, não um TTR linguístico completo.
Como as frases são detectadas?
O texto divide-se em ., ! e ?. Abreviações e decimais podem criar segmentos extra.
Por que o comprimento da palavra inclui pontuação?
Os tokens vêm tal como estão após divisão por espaços, por isso vírgulas ou aspas finais aumentam a contagem de caracteres.
O meu texto está seguro?
Sim. O processamento fica no seu dispositivo.
Em que difere de um contador de palavras?
Um contador de palavras totaliza palavras. Aqui também obtém médias, extremos e uma percentagem de unicidade.