Ir para o conteúdo
BouseMuttonBouseMutton

Extensão de ficheiro vs tipo de ficheiro

Uma extensão de ficheiro é a etiqueta depois do último ponto. Um tipo de ficheiro é o que os bytes lá dentro de facto representam. Na maior parte do tempo os dois concordam; quando não concordam, ganham os bytes. Esta página explica porquê e como detetar a diferença em menos de um minuto.

  • Explicação em linguagem simples
  • 4 veredictos cobertos
  • Os bytes nunca saem do seu navegador

Factos principais

  • Extensão

    A etiqueta final depois do último ponto num nome de ficheiro. Trivial de alterar. Uma pista, não um contrato.

  • Tipo de ficheiro

    O formato identificado pelos bytes dentro do ficheiro. Detetado lendo os primeiros bytes (a assinatura de bytes mágicos).

  • Quando divergem

    Quando alguém renomeia o ficheiro, quando não foi definida nenhuma extensão, ou quando o ficheiro é um poliglota (válido em mais do que um formato ao mesmo tempo).

  • Como o reportamos

    Quatro veredictos: MATCH, MISMATCH, AMBIGUOUS, UNKNOWN. Cada um é uma resposta determinística sobre a identidade do formato.

Uma extensão de ficheiro é a parte final de um nome de ficheiro, como .pdf ou .docx. O tipo de ficheiro é o que os bytes de facto representam. Em geral coincidem, mas não têm de coincidir.

Porque divergem

Qualquer pessoa pode renomear um ficheiro. invoice.exe renomeado para invoice.pdf continua a ter os bytes de um executável Windows; só a etiqueta mudou. O seu sistema operativo mostra um ícone PDF, mas o duplo clique iria executar o executável na mesma (ou uma ferramenta de segurança bloqueá-lo-ia). A extensão é barata e mente com facilidade.

O tipo de ficheiro é determinado pelos próprios bytes, a assinatura de bytes mágicos no início do ficheiro. Temos uma explicação mais longa em O que é um número mágico?.

Como saber qual está certo

  • MATCH

    Extensão e bytes concordam. O caso tranquilizador.

  • MISMATCH

    A extensão diz uma coisa, os bytes dizem outra. Abrande antes de abrir.

  • AMBIGUOUS

    Vários formatos conhecidos encaixam no mesmo prefixo (por exemplo, todos os documentos do Office são um ZIP).

  • UNKNOWN

    Nenhuma assinatura reconhecida. Muitas vezes texto simples; corremos depois um classificador de conteúdo com IA no computador.

Perguntas frequentes

Largue um ficheiro e veja o veredicto

A verificação corre localmente no seu navegador. Um de quatro veredictos em menos de um segundo. Os bytes nunca saem do seu dispositivo.

Abrir o Verificador de Tipo de Ficheiro