Meta Charset Tag en HTML5

Configurar a codificación de caracteres en HTML5

Antes da introdución de HTML5, configurando a codificación de caracteres nun documento con un elemento necesario para escribir a liña un tanto detallada que se ve a continuación. Estes son os elementos de Meta Charset se usas HTML4 na túa páxina web:

O que é importante notar neste codeare as comiñas que ves ao redor do atributo de contido : content = " text / html; charset = iso-8859-1 " . Do mesmo xeito que todos os atributos HTML, estas comiñas definen o valor do atributo, indicando que todo o texto / html; charset = iso-8959-1 é o contido deste elemento. Este é un HTML correcto e é como esta cadea estaba destinada a ser escrita. ¡Tamén é tremendo lonxe e feo! Tampouco é algo que probablemente recordarás da parte superior da túa cabeza. Na maioría dos casos, os desenvolvedores web deberían copiar e pegar este código desde un sitio a calquera outro que estean desenvolvendo porque escribir isto desde cero pedía moito.

HTML5 elimina as & # 34; Extra & # 34;

HTML5 non só engadiu unha serie de novos elementos ao idioma, pero tamén simplificou moito a sintaxe de HTML, incluíndo o elemento de Meta Charset. Con HTML5, pode engadir a codificación do seu carácter coa sintaxe moito máis fácil de recordar para o elemento META ves a continuación:

Compare esa sintaxe simplificada co que escribimos ao comezo deste artigo, a vella sintaxe utilizada para HTML4 e verás canto máis fácil é escribir e recordar a versión HTML5. En vez de ter que copiar e pegar isto desde un sitio existente en calquera outro novo no que estaba a traballar, isto é absolutamente algo que, como desenvolvedor web de interface, podería recordar. Este aforro de tempo moitos non é moito, pero cando teña en conta as outras áreas de sintaxe que HTML5 simplificou, as economías sumaranse.

Inclúa sempre a codificación de caracteres

Debería sempre incluír a codificación de caracteres para as túas páxinas web, mesmo se non desexas utilizar ningún tipo de caracteres especiais . Se non inclúe unha codificación de caracteres, o seu sitio vólvese vulnerable a un ataque de secuencias de comandos cruzado usando UTF-7.

Neste escenario, o anattacker ve que o seu sitio non ten codificación de caracteres definido, polo que fai que o navegador considere que a codificación de caracteres da páxina é realmente UTF-7. A continuación, o atacante inxecta scripts codificados UTF-7 na páxina web e o teu sitio está hackeado. Isto é obviamente problemático para todos os implicados, desde a túa empresa ata os teus visitantes. A boa noticia é que é un problema sinxelo de evitar: simplemente asegúrese de engadir codificación de caracteres a todas as súas páxinas web.

Onde engadir codificación de caracteres

A codificación de caracteres para unha páxina web debería ser a primeira liña do elemento de HTML. Isto asegura que o navegador sabe o que é a codificación de caracteres antes de que faga outra cousa na páxina que non sexa para determinar o ideario e identificar que é un Páxina HTML. O seu HTML debería ler:

...

Usando cabeceiras HTTP para seguridade extra

Tamén pode especificar a codificación de caracteres nos encabezados HTTP. Isto é aínda máis seguro que engadilo á páxina HTML, pero non tería acceso ás configuracións do servidor nin a ficheiros .htaccess, o que significa que pode ter que traballar co provedor de hospedaxe do seu sitio para obter este tipo de acceso ou facer que eles fagan os cambios para ti. O acceso é realmente o reto aquí. O cambio en si é sinxelo, así que calquera fornecedor de hospedaxe debería poder facer este cambio para a túa con relativa facilidade.

Se está a usarApache, pode configurar o conxunto de caracteres predeterminado para todo o seu sitio engadindo: AddDefaultCharset UTF-8 ao seu ficheiro root.htaccess . O conxunto de caracteres predeterminado de Apache é ISO-8859-1 .