La page 404 de Google

La page 404 de Google

La semaine dernière, Google a mis à jour sa page 404. « Hein quoi ? Google a une page 404 ? » Avec plusieurs milliards de pages vues par jour, il y a forcément bien un moment où un petit pourcentage d’internaute se retrouve face à une URL obsolète. La page en elle même est déjà assez rigolote, avec le langage technique commenté en gris clair « 404. Ca c’est une erreur ». Mais surtout, comme souvent avec Google, le code source de la page est un petit bijou d’optimisation d’intégration.

Le code source de la 404 de Google

Voici une petite liste non exhaustive des pratiques de Google permettant d’avoir une page super optimisée et totalement standard :

  • Doctype HTML5, carrément plus courte que les anciennes Doctype
  • Pas de quotes autour des attributs dans les balises
  • Styles compressés en une ligne dans une balise <style>
  • Image du robot encodée en Base64 directement dans les styles
  • Lien et image débutant par « // », relatifs au protocole de l’URL, permettant d’accéder à la page en HTTP ou HTTPS
  • Pas de <head>, pas de <body>
  • Pas de fermeture des balises <p>

En temps normal, ça ferait vomir plus d’un intégrateur pour l’intégration d’un site. Ce serait aussi un peu risqué pour la compatibilité entre navigateurs avec un design plus complexe. Mais pour une page aussi simple, et en particulier pour une 404, tous ces choix d’intégration sont on ne peut plus pertinent. Bien joué, Google, bien joué.

  1. Sam, le

    Et en plus elle valide !

    http://validator.w3.org/check?uri=http%3A%2F%2Fwww.google.com%2F404;No200=1

  2. Nicolas G, le

    Ces pratiques font partie intégrante des recommandation qu’ils ont mis en place dans leurs spec d’optimisation des performances… je n’ai pas testé le score de la page dans page speed mais je pense qu’il ne doit pas être loin du 100%.

    En tant qu’intégrateur ce qui me dérange le plus ce ne sont pas ces pratiques, mais plutôt le fait qu’elles soient sensiblement différentes des autres specs (yahoo….) et qu’elles ne soient pas « standardisées ».

  3. Aurélien, le

    Hello

    Ton article me fait penser au billet d’un pote SEO :
    HTMLminify ou la mort des standards W3C : http://blog.sitxpress.com/htmlminify-mort-standards-w3c/

  4. Thomas, le

    ça fait 2(3?) ans que google fait ce genre de page très optis, et ce sur toutes les pages de de résultats son moteur (en revanche ça change un peu selon l’UA de navigateur).

  5. Rémi, le

    @Sam : c’est toute la beauté de ce code.
    @Nicolas G : Comme l’a fait remarqué, la page est valide pour le W3C, et donc totalement standard. Par contre, je n’ai pas testé, mais j’ai vraiment un doute sur la capacité d’IE et de Firefox à interpréter correctement du code épuré comme ça (balises non fermées, etc…).
    @Aurélien : Je te connaissais pas HTMLMinify, mais ça semble pratique pour automatiser ce genre d’optimisations. Par contre bonjour la maintenance derrière.

  6. Nicolas G, le

    je me suis mal exprimé sorry, ce n’est pas la page qui n’est pas « standard » mais la spec d’optimisation des performance de google qui diffère beaucoup sur certains aspects des autres specs.

  7. Geoffray, le

    Une idée de ce que peut signifier le « !!1 » dans le titre ? Car ce n’est pas dans leurs habitudes de gaspiller 3 octets sans raison…

  8. Olivier Consultant, le

    La nouvelle page 404 de Google résume un peu l’esprit de l’entreprise avec la simplicité niveau utilisateur et l’expertise au niveau technique de la page. On remarquera aussi que Google présente différentes pages 404.

  9. Rémi, le

    @Geoffray : Je me suis posé exactement la même question. Et après un peu de recherche, la seule réponse que j’ai pu trouvé, c’est… « for the lulz ». Pour faire comme un robot (ou un ado prépubert) qui tape frénétiquement sur son clavier (US, QWERTY) et tape un 1 au lieu d’un !.