Você sabia que o Google indexa conteúdo em diferentes tipos de armazenamento com base na probabilidade de serem pesquisados/
Gary Illyes, do Google, revela que o índice de busca usa um sistema em camadas onde o conteúdo mais popular é indexado em um armazenamento mais rápido e caro.
Este tópico é discutido no último episódio do podcast Search Off the Record do Google, que trata da complexidade da linguagem na seleção do índice de pesquisa.
Ao explicar como o Google constrói o seu índice de pesquisa, Illyes diz que o conteúdo é indexado em três tipos de armazenamento:
O Google reserva o armazenamento mais rápido para documentos que provavelmente serão exibidos nos resultados de pesquisa com frequência.
Illyes afirma:
E então, quando construímos nosso índice, e usamos todos os sinais que temos. Vamos escolher uma, digamos, classificação de página e, em seguida, tentar estimar o quanto serviríamos aos documentos que indexamos. Então, será como a cada segundo? Teremos uma consulta que acione esses documentos? Ou será uma vez por semana ou uma vez por ano? E com base nisso, podemos usar diferentes tipos de armazenamento para construir o índice.
Illyes continua dando exemplos do que seria armazenado na RAM, o que seria armazenado em SSDs e o que seria armazenado em HDDs.
O conteúdo acessado a cada segundo acabará sendo armazenado na RAM ou SSDs. Isso representa uma pequena quantidade de todo o índice do Google.
A maior parte do índice do Google é armazenado em discos rígidos porque, nas palavras de Illyes, os discos rígidos são baratos, acessíveis e fáceis de substituir.
Então, por exemplo, para documentos que sabemos que podem surgir a cada segundo, por exemplo, eles acabarão em algo super rápido. E o super rápido seria a RAM. Como, parte do nosso índice de serviço está na RAM. Então teremos outro nível, por exemplo, para drives de estado sólido, porque eles são rápidos e não tão caros quanto a RAM. Mas ainda não – a maior parte do índice não estaria nisso. A maior parte do índice estaria em algo que é barato, acessível, facilmente substituível e não quebra o banco. E isso seria discos rígidos ou disquetes.
É claro que Illyes está brincando sobre disquetes, esse é o tipo de humor seco que você recebe dele no podcast :)
Segundo o comentarista do SEJ, Matt Southern está é a primeira vez que o Google abre ao público informações sobre seus níveis de armazenamento de índice de pesquisa. É interessante saber que o conteúdo mais procurado está armazenado em RAM e SSDs.
O custo de armazenar até mesmo uma porcentagem do índice do Google em RAM e SSDs deve ser exorbitante. Embora seja provável que o custo de armazenamento mais rápido seja justificado pela importância dos documentos para as pessoas.
A demanda pelo conteúdo deve ser tão alta que o Google não quer correr o risco de atrasar sua divulgação aos usuários.
No que se refere ao SEO, não há como otimizar um tipo de armazenamento em detrimento do outro. E não há como saber em qual camada de armazenamento o seu site está indexado.
Meu palpite é que uma porcentagem decididamente pequena de páginas da web são indexadas em RAM ou SSDs. Trazendo de volta para o SEO, isso é bom, pois significa que a maioria dos sites está competindo em igualdade de condições quando se trata de velocidade de armazenamento de índice.
Caso queira ler o artigo do Matt na integra, acesse o link abaixo.
Fonte: https://www.searchenginejournal.com/google-uses-faster-storage-for-high-demand-pages/
Uma solução de Segurança da Informação e Gestão de Eventos (SIEM) é fundamental para manter…
Quer você saiba ou não, se você navega na internet, você interagiu com uma API.…
Ransomware é um malware que emprega criptografia para manter as informações da vítima sob resgate.…
Os hackers éticos desempenham um papel fundamental na segurança cibernética, usando suas habilidades técnicas para…
Os ataques de ransomware são um pesadelo digital que parece saído de um filme, mas…
O balanceamento de carga (load balancer) é uma técnica fundamental para distribuir o tráfego de…