Thread by @seostratega: "El 4 de septiembre cumplió oficialmente 20 años. He creado este "pequeño" hilo con claves y anécdotas de los inicios de Google y cóm […]" #Google #SEO

, 44 tweets, 10 min read Read on Twitter

El 4 de septiembre #Google cumplió oficialmente 20 años. He creado este "pequeño" hilo con claves y anécdotas de los inicios de Google y cómo se convirtió en el buscador más importante del mundo.

Espero que sea de interés para SEOs y no SEOs -->

1996. Larry Page se está doctorando en Computer Science en Stanford y busca tema para su tesis mientras surfea por internet. La web es una masa de páginas enlazadas entre sí, pero sin ninguna jerarquía. Page idea un sistema para ponerlas en orden, similar a la citación académica.

El análisis de citaciones se usa en el sistema académico desde los años 60, para calcular la importancia de un ensayo científico. Cuanto más lo citan otros trabajos, más importante. Y en eso se basa el PageRank, el algoritmo original de Google para rankear documentos.

Terry Winograd, supervisor de Page en Stanford, le dijo que era una gran idea para la tesis, pero le advirtió de un problema técnico: ¿cómo rastrear e indexar toda la web? Larry contestó que lo haría, pensando que tardaría una semana en hacerlo. Tardó varios meses.

Page no trabajó solo. El primero en unirse fue su amigo y compañero en Stanford Sergey Brin, que estaba trabajando en sistemas de data mining. Al saber la idea de Larry, lo dejó todo y aportó sus conocimientos de cálculo al proyecto (Sergey era un genio matemático)

Page escribió un primer programa en Java para rastrear la web. Pero estaba lleno de bugs y Java se bloqueaba. Recurrieron a Scott Hassan, profesor en Stanford, que tras mucho pelear con el código, decidió reescribirlo totalmente en Python, consiguiendo un código mucho más estable

El programa, un crawler o bot tal y como lo conocemos hoy, visitaba una página, apuntaba todos los links que había en esa página y los añadía a una cola para visitar luego. Si en la cola había páginas ya visitadas, las saltaba y seguía repitiendo el proceso una y otra vez.

Marzo de 1996. El primer test. La primera página rastreada fue la página de inicio del dpto de Computer Science en Stanford. El programa se llamaba Backrub, porque trataba de descubrir los backlinks de una página (todas las páginas de internet que enlazan a esta)

El primer rastreo consiguió indexar 15 millones de páginas. Sólo guardaban los títulos, no el documento entero, ya que no tenían espacio suficiente. Los primeros resultados dejaban claro que Backrub podía ser un buscador muy superior al líder del momento: Altavista

La razón estaba en PageRank, un algoritmo engañosamente simple que rankea los documentos no sólo según el número de enlaces que recibe, sino según la importancia de las páginas que la enlazan. Para ser efectivo, este cálculo necesita "conocer" la práctica totalidad de la web

Y eso es lo que hicieron Page y Brin, convertir la web en una ecuación gigantesca con cientos de millones de variables (el Page Rank de cada documento) y miles de millones de términos (los enlaces entre documentos)

El PR de una página concreta es una función que añade el PR de cada una de las páginas que la enlazan, dividido entre el número de enlaces salientes que tiene cada una de esas páginas, y sustrayendo en cada caso un porcentaje de PR que se diluye (el damping factor)

Esta ecuación simula el comportamiento de una persona que navega por la web, haciendo clic de manera aleatoria en los enlaces que se va encontrando. El PR de una página es la posibilidad de que esta persona "aterrice" en esa página siguiendo enlaces al azar.

El damping factor representa la posibilidad de que esa persona se canse de seguir enlaces y simplemente escriba una nueva url en el navegador para ir a un lugar de la web no enlazado desde la página actual.

En el algoritmo original el damping factor valía 0.85. Es decir, el PR que pasa cada página a las que enlaza, se multiplica por 0.85, con lo cual se "está perdiendo" por el camino un 15% del PR (siempre según la fórmula original del PR)

Seguimos. Otros algoritmos basados en enlaces para calcular la importancia de una página, y desarrollados más o menos al mismo tiempo que el PR, son el HITS de Jon Kleinberg y RankDex, de Robin Li, que incluso fue patentado en 1997 por Dow Jones, la empresa donde trabajaba Li

Anécdota: Li volvió a China y en el año 2000 creó Baidu, el buscador número 1 de China, donde Google nunca ha conseguido penetrar, debido a sus problemas con la censura china y a la posición dominante de Baidu.

Anterior a HITS y PageRank fue un proyecto de buscador llamado HyperSearch, ideado por Massimo Marchiori. Page lo conocía, porque lo cita en la patente de PageRank de 1998. Pero no tuvo aplicación en el mundo real, ya que Marchiori no consiguió fondos para elaborar su idea.

Ni HITS, ni RankDex ni la idea de Marcheri pasaron nunca de teorías o experimentos iniciales, mientras que PageRank tuvo una aplicación casi inmediata. David Cheriton, prestigioso profesor de Stanford, animó desde el principio a Page y Brin a convertir su buscador en un negocio.

Lo primero que intentaron fue vender su tecnología a otros buscadores. Tuvieron reuniones con Yahoo, Altavista y Excite. Esta última estuvo a punto de dar el sí, hasta que el CEO de Excite se dio cuenta de que Backrub era "demasiado bueno" encontrando resultados...

La razón era que los ingresos de Excite dependían del tiempo que los usuarios pasaban buscando resultados en sus páginas. Si los encontraban demasiado rápido, como hacía Backrub, eso era "malo" para el negocio. Excite perdió una de las mayores oportunidades de todos los tiempos

Excite y Altavista se hundieron porque ponían por delante su capacidad de generar ingresos, incluso si esto significaba perjudicar al usuario. Google siempre puso por delante al usuario. Cuanto antes encuentre lo que busque, mejor. Y así se convirtió en el buscador número uno.

Como nadie quería comprar, Page y Brin decidieron montar el negocio por su cuenta. Había que poner un nombre. Alguien en Stanford sugirió "Googol", que significa un 1 seguido de cien ceros. Page escribió "Google" por error, pero fue una suerte, porque el dominio estaba libre.

Brin creó el logo y la página de inicio con GIMP, un software libre que todavía se usa hoy. Como no sabía de diseño y no quería complicarse, dejó la página casi en blanco. Esto lo diferenció de la competencia desde el principio, y además ayudaba a que Google cargase más rápido.

Ahora faltaban inversores. Cheriton les puso en contacto con Andy Bechtolsheim, pez gordo de Silicon Valley. Bechtolsheim vio una demo de Google y 10 minutos después ya había firmado un cheque de 100.000 dólares a nombre de Google, Inc. Page y Brin lo celebraron en un Burger King

Antes de marcharse en su descapotable, Bechtolsheim les dio una pequeña sugerencia: "Deberíais poner publicidad en el buscador". A partir de ahora se debían a sus inversores. El problema de la publicidad no se resolvería completamente hasta 2002.

Hicieron el papeleo para convertirse en una Inc (más o menos equivalente a nuestra SA) y sacaron sus ordenadores de Stanford. Su primera oficina, un garaje en casa de Susan Wojcicki, amiga de Brin y poco después empleada clave de Google (ha sido head de AdWords y CEO de YouTube)

La primera adquisición de Page fueron más ordenadores, para albergar su index, que no paraba de crecer. Los compró a precio de saldo, una constante que presidiría su estrategia de data centers e infraestructura low cost para escalar su bestial expansión.

No gastaron ni un céntimo en marketing para dar a conocer su producto. Preferían gastar en servidores y fichar ingenieros. Sabían que el boca a oreja estaba funcionando, y Google empezaba a salir de los círculos de Stanford y Silicon Valley...

Más gente quería invertir. En 1998 entraron Cheriton, Ram Shriram y Jeff Bezos, el fundador de Amazon, aumentando el capital de Google hasta 1 millón de dólares. Y sólo un año después, en una ronda de 25 millones de dólares entraron los principales inversores de Silicon Valley.

Volvemos a 1998. El mundo empezaba a conocer a Google. Usarlo por primera vez y convertirlo en tu buscador favorito era todo uno. Hasta los ingenieros de AltaVista reconocían que era 10 veces mejor que su producto, y todos querían desertar para irse a Google (muchos lo hicieron)

Algunos de los fichajes estrella de esta etapa y que serían nombres clave en el ascenso y evolución de Google: Urs Holzle, Jeff Dean, Krishna Bharat, Ben Gomes, Amit Singhal... Google estaba construyendo un Dream Team. Machacar a la competencia era cuestión de tiempo.

El crecimiento no fue fácil. El index sólo podía actualizarse si tenían espacio disponible en sus servidores. Y la web crecía tan rápido que cada vez era más díficil pretender indexarlo todo. Peor: si un solo crawler fallaba, había que empezar toda la indexación de nuevo.

En el año 2000, el index de Google pasó varios meses sin actualizarse. Jeff Dean ideó un nuevo sistema que permitió superar la crisis. Guardaba el index "en partes" de forma paralela, para que un error no afectase a todo el sistema. Siempre había copias de seguridad.

No sólo mejoró el rastreo e indexado. Amit Singhal reescribió en 2001 el código que evaluaba la relevancia de una página. Se probó con usuarios reales y vieron que aumentaba la satisfacción con los resultados. Habían nacido los updates del algoritmo para mejorar sus resultados.

Aquí entra Matt Cutts, primer líder del departamento anti-spam de Google. Cutts empezó trabajando en un filtro llamado SafeSearch, para que los usuarios pudieran bloquear la aparición de páginas porno entre los resultados de sus búsquedas.

Buscando páginas porno que bloquear, se dio cuenta de que ciertos sitios habían descubierto cómo engañar al algoritmo de Google, rankeando alto para búsquedas donde no merecian estar. El #SEO empezaba a asomar la cabeza y Cutts se convirtió en nexo entre Google y la comunidad SEO

¿Y la publi? Page y Brin eran reacios a incluir publicidad de cualquier manera, algo de lo que Altavista y otros abusaban. Pero si tuvieran un sistema para mostrar resultados de publicidad relevantes para la búsqueda del usuario... ¡Eso sería la gallina de los huevos de oro!

El primer embrión de este sistema fue obra de Jeff Dean y Marissa Mayer (luego CEO de Yahoo). Escrapearon Amazon, y cada vez que alguien buscaba un libro que estaba en Amazon, aparecía un resultado de pago con un enlace afiliado hacia Amazon. Luego se abrió a otros anunciantes.

La clave fue un sistema de puja, basado en la cantidad que el anunciante estaba dispuesto a pagar y la calidad que un algoritmo asignaba a cada anuncio. Fue idea de Eric Veach (un ingeniero que decía odiar los anuncios) y Salar Kamangar, autor del primer business plan de Google

Así nació AdWords, plataforma pensada para pequeños anunciantes. Cualquiera podía meter su tarjeta de crédito y pujar por clics en las keywords elegidas. Su novedad era que no pagabas el 100% de tu puja, sino sólo un céntimo más de lo que ofrecía el siguiente anunciante.

AdWords daba anuncios relevantes para las búsquedas, que no molestaban a los usuarios, y los anunciantes se apuntaban en masa a probarlo. Gracias a AdWords, 2002 fue el primer año con beneficios para los inversores. Google había encontrado su gallina de los huevos de oro.

Aún hoy, la publicidad en Google sigue significando el 90% de los ingresos de Alphabet. Adwords no habría sido posible sin la gran calidad de los resultados orgánicos (no de pago) de Google. Y el negocio millonario de Google no habría sido posible sin Adwords.

Y así empezó un negocio que hoy genera miles de millones de dólares, y que en mi opinión tiene muchos años por delante. El Imperio Google no ha hecho más que comenzar.

RT y FAV al tuit original del hilo si te ha gustado 😀