Las ventanas de Internet: Buscadores

Me apasiona el caracter retroactivo de las redes. Es sorprendente cómo cualquier tecnología evoluciona siguiendo patrones biológicos, adaptándose al medio, y generando en su transcurso caminos alternativos que no hacen más que engrandecer el ecosistema común.

buscadores

Un servidor conoció internet ya desde la perspectiva de los buscadores (Altavista, que casualmente era cerrado hace escasos días por Yahoo (ES), su actual dueño). Antes de la llegada de estas aglutinadoras, estuvieron los directorios de enlaces (de hecho coexistieron durante mucho tiempo), y antes el vacío.

Internet supuso un nuevo paradigma comunicativo, el tercer entorno. Un modelo de comunicación masivo y diversificado, sincrono o asíncrono. El comienzo de una nueva realidad, con sus propias leyes y como, con sus propias carencias.

En nuestro entorno, ocurrió en su momento algo semejante. Como seres gregarios que somos, fuimos poco a poco agrupándonos, creando nodos sociales, abstrayendo la complejidad de la vida mediante rutinas y trabajos. Pero llegó el punto en el que esos nodos no eran suficiente para una raza en continua expansión, y así nacieron los caminos, las carreteras, las rutas, el correo, el ferrocarril, las líneas de telefonía,… Elementos consecuencia de las necesidades de comunicación entre nodos, y que vuelven a repetirse en nuestro tercer entorno.

En la actualidad, accedemos a internet mediante una de estas ventanas, un camino para llegar a otro. De vez en cuando, nos comunicamos directamente con una IP, pero por lo general, resulta más cómodo preguntarle a un buscador, y que sea él quien se encargue de establecer la comunicación.

Como podéis ver, delegamos una tarea tan sumamente  prioritaria en servicios externos, dotando a éstos de un valor incalculable (controlar los resultados de una búsqueda es controlar la visibilidad real de un nodo, así como el navegador permite controlar qué buscador se usará por defecto).

Seguramente la mayoría de los que me leéis (un servidor incluido), usáis Google o Bing como ventana a internet. Son los dos más masificados en el mundo occidental, pero en esencia solo proponen más de lo mismo. Existen en cambio otras alternativas, normalmente más específicas y no tan genéricas, cuyo uso puede llegar a sorprendernos. Es así como quería empezar esta entrada, hablándoos de los tipos de buscadores.

Buscadores Genéricos

Podríamos incluir en este grupo la gran mayoría de buscadores que conocemos. Google o Bing porque nos quedan más cerca, pero seguramente alguna vez habéis oído hablar del buscador ruso Yandex (RU), o Baidu (CH) si nos trasladamos a China.

Tienen en común el ser generalistas y funcionar principalmente por el rastreo sistemático de enlaces en busca de grupos de palabras.

Quizás en este punto, me gustaría señalar a DuckDuckGo (EN), un buscador que ha hecho su agosto recientemente gracias al caso PRISM, ya que es de los pocos en los que podemos confiar en que no guarda nuestras búsquedas, manteniendo el anonimato de sus usuarios.

Buscadores semánticos

La evolución del concepto de los Buscadores Genéricos. Ya no nos interesa únicamente buscar palabras dentro de una web, sino que el propio motor del buscador reconozca patrones semánticos que nuestro cerebro es capaz de analizar. Google Now es quizás el ejemplo más inmediato (no nos muestra una lista de posibles enlaces, sino la respuesta a nuestra pregunta), pero sin duda uno de los precursores y más avanzados buscadores semánticos es Wolfram Alpha (EN), basado en el modelo de respuesta y toma de decisiones.

También podemos encontrar atisbos de esta rama de estudio en Google Images, Siri y su homólogo en Android.

Todos se basan en ese llamado grafo del conocimiento, una sucesión de nodos interconectados entre sí, con datos comunes. Un acercamiento de la informática a la gestión neuronal de nuestras mentes, y un campo en continua expansión.

Buscadores sociales

En una web puramente social, está claro que los buscadores sociales deberían ser tenidos en cuenta. Así es como nacen proyectos como Graph Search de Facebook, un agregador de contenido segmentado por todo aquello que es visible en tus círculos sociales.

La idea no es nueva, y hemos visto como paulatinamente se va abandonando la tendencia a la homogeneidad en favor de una segmentación propia, lo cual tiene sus puntos positivos (más porcentaje de éxito, menos gasto de tiempo en búsquedas infructuosas) y sus negativos (dependencia de unos círculos sociales que aporten el suficiente valor para que su contenido sea interesante para nosotros).

A día de hoy, en mayor o menor medida todas las redes sociales tienen un pequeño buscador social, que en algunos casos funciona como uno genérico enfocado a su plataforma (LinkedIn sin ir más lejos), y en otros (véase Google+), poco a poco va agregando características únicas aprovechando la información y contextualización que estas redes ofrecen.

Buscadores especializados

Quería agrupar en esta sección aquellos buscadores que por sus características, están enfocados a un público muy particular.

Así me gustaría hablar de Shodan (EN), ese buscador que usa las metatags de todos los archivos de una web para realizar consultas atendiendo al hardware o características contextuales que hay detrás. Así es como mediante filtros, puedes acceder a información que aparentemente jamás tendrías de una web, muy útil para aquellos que se dedican a la seguridad informática, o para gobiernos que quieren mantener controlados a sus ciudadanos, o al resto de países.

Algunos de los filtros (ES) utilizados son:

  • City –> Filtro para buscar dispositivos ubicados en la ciudad dada. Ejemplo: city:Madrid
  • Country –> Se utiliza para reducir los resultados por país. Ejemplo: country:ES
  • Geo –> Permite encontrar los dispositivos que se encuentran dentro de un radio determinado de la latitud y la longitud dada. Ejemplo: geo:42.9693,-74.1224
  • Hostname –> Permite buscar los hosts que contienen el valor de su nombre de host. Ejemplo: hostname:Google
  • Net –> Proporciona un mecanismo para limitar los resultados de la búsqueda a una IP o una subred específica. Ejemplo: net:74.125.239.44
  • Os –> Se utiliza para buscar por sistemas operativos específicos. Ejemplo: os:Linux
  • Port –> Se utiliza para limitar la búsqueda a los servicios específicos. Ejemplo: port:80
  • Before/After –> Permite buscar sólo antes o después de la fecha indicada. Formatos de fecha válidos son: día/mes/año. Ejemplo: after:17/06/2013

También quería hablaros de The Wayback Machine, un buscador histórico, esto es, un auténtico repositorio de imágenes del aspecto de las webs en diferentes momentos de su historia.

Decir además que la mayoría de grandes buscadores de internet cuentan así mismo con módulos enriquecidos específicos que no hacen más que engrandecer las posibilidades de búsqueda del usuario, abarcando o reduciendo el abanico de resultados según sea de nuestro interés.

 

Edit a día 8 de Julio del 2013: Incluyo además la herramienta 123people (ES), un buscador centrado en personas, que realiza búsquedas en internet referentes a datos cercanos a los usuarios por su nombre (dirección, teléfono, conocidos, perfiles sociales,…).