Estatísticas de texto

Análise avançada de texto

Médias, palavras e frases mais longas e mais curtas, e riqueza do vocabulário.

Ferramentas relacionadas

Por que usar estatísticas de texto?

Veja se as frases ficam longas demais, se as palavras são incomuns em comprimento ou quão variado parece o léxico — antes de NLP pesado ou de enviar a um editor.

Benefícios

  • Médias: comprimento médio de palavra e frase de relance.
  • Extremos: detetar valores atípicos de comprimento.
  • Riqueza: percentagem simples únicos face ao total.
  • Ao vivo: métricas atualizam enquanto escreve.
  • Privado: só no cliente, sem servidor.

Como funciona

Divisões e aritmética em JavaScript — adequadas a texto simples parecido com inglês, não substituem ferramentas linguísticas.

O que mostra

  • Palavras: `trim` e depois divisão por espaço em branco.
  • Frases: divisão em . ! ? e remove segmentos vazios.
  • Palavra mais longa/curta: pelo comprimento bruto do token.
  • Frase mais longa/curta: pela contagem de palavras em cada segmento.
  • Riqueza: tamanho do `Set` de formas normalizadas sobre contagem de tokens.

Quando usar

Revisão de rascunhos, trabalhos de estudantes, newsletters e comparações rápidas entre duas versões coladas.

Casos de uso ideais

  • Edição: apanhar uma frase gigante.
  • Estilo: ver se médias mudam entre secções.
  • Ensino: demonstrar métricas simples.
  • QA: antes de pontuações de legibilidade especializadas.
  • Privacidade: rascunhos pensados para offline primeiro.

Factos

Limitações importantes.

Pontos-chave

  • O comprimento médio de frase usa contagem simples de frases; divisões vazias são filtradas.
  • A frase mais longa na UI pode truncar após 100 caracteres por layout.
  • Palavras hifenizadas e contrações contam como um token.
  • Scripts não latinos podem afetar a normalização do conjunto de riqueza.
  • Colagens muito grandes podem atingir limites de memória do navegador.

Boas práticas

Use com critério.

Qualidade

  • Combine com ferramenta de legibilidade para notas graduadas.
  • Em contagens legais ou académicas, siga a definição oficial de «palavra».
  • Limpe marcação para texto simples primeiro para métricas justas.
  • Compare rascunhos com a mesma higiene de colagem.
  • Não trate a riqueza como único sinal de qualidade SEO.

Quando não confiar

  • Quando limites de frase devem coincidir com o guia da editora.
  • Quando precisa de estatísticas de sílabas, lemas ou n-gramas.
  • Como substituto de suites de plágio ou SEO.

Limitações e compatibilidade

Métricas heurísticas; entrada em área de texto simples; requer JavaScript.

Alimentado por processamento no lado do cliente.

Perguntas frequentes

A ferramenta de estatísticas de texto é gratuita?

Sim. A análise corre no seu navegador. Não é preciso registar-se nem enviar o texto a um servidor.

O que significa riqueza do vocabulário aqui?

Formas de palavra únicas (minúsculas; removidos caracteres não alfanuméricos da chave) divididas pelo total de palavras, vezes 100. É uma proporção tipo–token simples, não um TTR linguístico completo.

Como as frases são detectadas?

O texto divide-se em ., ! e ?. Abreviações e decimais podem criar segmentos extra.

Por que o comprimento da palavra inclui pontuação?

Os tokens vêm tal como estão após divisão por espaços, por isso vírgulas ou aspas finais aumentam a contagem de caracteres.

O meu texto está seguro?

Sim. O processamento fica no seu dispositivo.

Em que difere de um contador de palavras?

Um contador de palavras totaliza palavras. Aqui também obtém médias, extremos e uma percentagem de unicidade.

Estatísticas de texto: análise avançada online grátis