O impacto dos caracteres especiais nos URLs tem sido objeto de discussão entre os desenvolvedores da web e os especialistas em SEO.
Muitos profissionais do setor desaconselham o uso de caracteres não ASCII em URLs, frisando a importância de manter os URLs curtos e diretos.
ASCII (pronuncia-se “askee”), que significa Código Padrão Americano para Intercâmbio de Informações, é a representação numérica de caracteres que permite a transferência de dados entre computadores. Originalmente um código de 7 bits que representava 128 caracteres, ele foi posteriormente expandido para um código de 8 bits, representando 256 caracteres.
Embora em algumas ocasiões a inclusão de caracteres especiais possa melhorar a legibilidade, ela geralmente complica o gerenciamento de URLs e pode levar a problemas de indexação e posicionamento nos mecanismos de busca. Neste artigo, vamos nos aprofundar nas razões subjacentes a esses desafios e explorar as práticas recomendadas para criar URLs eficazes.
Por que evitar o uso de caracteres especiais?
Um URL (Uniform Resource Locator) é basicamente uma sequência de caracteres alfanuméricos que identifica de forma unívoca um endereço IP ou um recurso on-line, fazendo com que um site seja acessível por meio de um navegador.
Os URLs têm um valor informativo duplo: eles fornecem aos usuários informações sobre uma página da web e facilitam a indexação pelos mecanismos de busca, influenciando as classificações das páginas de resultados dos mecanismos de busca (SERP).
Para maximizar a legibilidade e a memorização, deve-se evitar o uso de caracteres especiais nos URLs. Os caracteres especiais incluem quaisquer símbolos que não sejam letras ou números, como sinais de pontuação e símbolos matemáticos. Nos URLs, as palavras são geralmente separadas por hífens:
www.nomedosite.com/por-que-evitar-caracteres-especiais
Se substituirmos os hífens por um caractere não ASCII, como um espaço, ele é geralmente convertido em um código como %20:
www.nomedosite.com/por%20que%20evitar%20caracteres%20especiais
Claramente, o segundo exemplo é mais difícil de ler, digitar e lembrar. Para evitar esses problemas, é importante prestar atenção aos caracteres e símbolos usados nos URLs.
CMSs e caracteres especiais
Os sistemas de gerenciamento de conteúdo (CMSs), como o WordPress, estão entre as opções mais populares para criação e manutenção de sites, mesmo entre usuários menos experientes.
Para simplificar o processo, sobretudo para iniciantes, os CMSs são projetados para lidar com caracteres não ASCII, decodificando-os automaticamente. Por exemplo, eles removem os apóstrofos e substituem os espaços por hífens.
Essa funcionalidade garante que mesmo os iniciantes possam manter blogs com URLs claramente legíveis e fáceis de usar.
Caracteres especiais e questões técnicas
Apesar dos avanços que simplificam muitos processos atualmente, ainda é aconselhável evitar o uso de caracteres incomuns, como apóstrofos, sobrescritos, letras acentuadas e símbolos como o ícone de marca registrada. Além de melhorar a capacidade de memorização, essa precaução também afeta a visualização do recurso.
Na codificação, o uso de caracteres não ASCII em caminhos de URL relativos, em vez de caminhos de URL absolutos, pode causar problemas. Um caminho relativo especifica um URL relativo ao local da página atual, com base no diretório atual ou na estrutura do site, e não inclui o nome de domínio ou protocolo. Nesses casos, até mesmo os crawlers do Google podem traçar o caminho errado, levando a páginas de erro 404 internas.
Concluindo, lembre-se sempre de que, a despeito dos pontos discutidos, três elementos principais afetam um URL: o sistema operacional, o navegador e o dispositivo. É um princípio fundamental evitar caracteres especiais, o que aumenta a portabilidade de um recurso da web, garantindo a compatibilidade entre diferentes softwares e hardwares. Reduzindo ao mínimo o uso de caracteres especiais, você também reduz os riscos associados ao manuseio de URLs e melhora a experiência geral do usuário.