Soplando al Cierzo: WAIS, ARCHIE y GOPHER

miércoles, 10 de enero de 2007

WAIS, ARCHIE y GOPHER

Los predecesores del WWW

En los primeros tiempos de Internet todavía no existían los servidores Web, ya que aún tardaría bastante en crearse el lenguaje HTML, auténtico impulsor de la Web. Archie, Gopher o WAIS no son sino los antepasados de los actuales buscadores Web.

Con el aumento de usuarios y servidores cada vez era más complicado localizar un determinado fichero o recurso en Internet . Se crearon los servicios Archie, Gopher o WAIS para permitir el acceso a un volumen tan enorme de datos y que iba en constante aumento.
El servicio prestado por Gopher, aunque estaba concebido para ser distribuido, es muy similar a cualquier Índice Jerárquico de hoy día, donde la información se estructura en temas y al ir seleccionando alguno de ellos se muestra una selección de subtemas y así sucesivamente hasta que llegamos (si es el caso) al recurso deseado. El servicio de Archie era muy similar al de cualquier buscador Web, ya sea un Índice como Yahoo o un Motor de Búsqueda como Lycos.

Archie era un sistema de localización de ficheros a través de bases de datos que contenían la información almacenada en los servidores de FTP anónimo. Para utilizarlo era necesario un cliente que permitía conectarnos a los servidores Archie donde podíamos localizar un determinado archivo. En dicho cliente se introducía una cadena de búsqueda y en función de la misma se mostraban los servidores de FTP que contenían archivos relacionados con la misma. Si configurábamos un cliente FTP podíamos bajarnos directamente cualquiera de los archivos mostrados. Hoy en día ha sido sustituido por otras herramientas más funcionales.
Gopher, es un sistema diferente, es otro servicio en el que sus servidores organizaban la información en árboles jerárquicos sobre cuyas ramas íbamos descendiendo en función del tema elegido.

De esta manera, al conectarnos a un servidor de este tipo, éste mostraba el árbol principal y al seleccionar una rama se conectaba a otro (o al mismo) servidor donde se encontraba el subárbol correspondiente. Cada vez que bajábamos una rama podíamos permanecer en el mismo servidor o pasar, de forma totalmente transparente para nosotros, a otro servidor. Al final se accedía al recurso deseado, que podíamos bajarnos directamente a través de FTP, o mediante una conexión mediante Telnet al servidor que lo contenía.

####WAIS####

WAIS (Wide Area Information Servers) es un sistema de busqueda de texto distribuido que usa el protocolo standart cliente servidor ANSI Z39.50 para buscar bases de datos indexadas en ordenadores remotos. WAIS permite a los usuarios descubrir la información y resuelve el acceso a la información en la red sin tener en cuenta su ubicación física.
El protocolo y los servidores WAIS fueron primeramente evangelizados por Thinking Machines Corporation, una empresa de supercomputadoras de Cambridge fundada en 1982 por W. Daniel "Danny" Hillis y Sheryl Handler para convertir la tesis doctoral de Hillis en el MIT sobre arquitecturas de computación en paralelo masiva en un producto comercial llamado Connection Machine.
Connection Machine era la alternativa a la arquitectura de Neumann. La CM-1 originalmente concevida en el MIT, era una agrupación de miles de microprocesadores o CPU´s, cada uno con su propia RAM, archivando datos paralelamente con SIMD (Single Instruction, Multiple Data). Primeramente se pensó usar esta supercomputadora para aplicaciones en inteligencia artificial y procesamiento de símbolos, pero luego encontró un gran éxito en el campo de la ciencia computacional. Danny Hillis y Sheryl Handler fundaron Thinking Machines en Waltham, Massachusetts (más tarde se cambiaron a Cambridge, Massachusetts) en 1983 y establecieron un equipo para desarrollar la CM-1 y después la CM-2, la que, dependiendo de la configuración, tenía unos 65,536 procesadores. Los procesadores individuales eran extremadamente simples ya que procesaban un bit cada vez. La CM-2, que se lanzó en 1987, añadía Weitek 3132 floating-point co-procesadores numéricos al sistema, con 32 de los procesadores simples originales compartiendo cada procesador numérico. También se produjeron dos variantes posteriores más a la CM-2, la pequeña CM-2a con procesadores single-bit 4096 o 8192, y la rápida CM-200.

Thinking Machines presentó un servidor WAIS que corría bajo sus supercomputadoras CM-1 y CM-5. Los clientes WAIS eran para varios sistemas operativos incluyendo Windows, Macintosh y Unix. Con el anuncio del World Wide Web a principios de 1990 y la bancarrota de Thinking Machines en el 95, la primitiva interface del sistema WAIS rápidamente cedió su lugar a los motores de búsqueda basados en Web. En el Internet actual ya no hay servidores WAIS activos.
Uno de los desarrolladores de WAIS era Brewster Kahle, quien abandonó Thinking Machines para fundar WAIS Inc en Menlo Park, California con Bruce Gilliat. Tras vender WAIS a AOL en mayo de 1995 por $15 millones, Kahle and Gilliat fundaron Internet Archive (IA) y más tarde la empresa Alexa Internet.

Fuente: Federal Standard 1037C

Links interesantes:

Nordic WAIS Project, the WWW/WAIS gateway software: http://www.lub.lu.se/auto_new/UDC.html

Presentación pública de Brewster Kahle sobre WAIS unos 2 meses después de sacar su versión en código abierto a Internet. Esta fue el primer sistema de publicaciones de Internet, precediendo a gopher y al World Wide Web. Fue grabada en Xerox PARC en California:
http://www.archive.org/details/wais_supercomputer_parc

Thanks Brewster Kahle for this donation of a chip from a Connection Machine 1 or 2
http://www.digibarn.com/collections/parts/connection-machine-chip/index.html

Neal Stephenson (left) and Brewster Kahle visit the DigiBarn after the Hacker's conference, November 2004: http://www.digibarn.com/history/04-11-Kahle-Stephenson/index.html

The Connection Machine website:
http://www.mission-base.com/tamiko/cm/index.html

####ARCHIE####

Archie fue el primer motor de búsqueda que se ha inventado, diseñado para indexar archivos FTP, permitiendo a la gente encontrar archivos específicos. La implementación original se escribió en 1990 por Alan Emtage, Bill Heelan, y Peter J. Deutsch, entonces estudiantes en la Universidad McGill de Montreal.
Las primeras versiones de archie simplemente contactaban una lista de archivos FTP en bases regulares ( contactando cada una apenas una vez cada mes, para no gastar muchos recursos en los servidores remotos) y requiriendo un listado. Estos listados eran almacenados en ficheros locales para ser buscados usando el comando grep de UNIX. Más tarde, se desarrollaron front- y back-ends más eficaces, y este sistema pasó de ser una herramienta local a un recurso para toda la red, a un servicio popular accesible desde múltiples sitios de Internet. A tales servidores se podía acceder de muchas formas: usando un cliente local (como archie o xarchie); haciendo telnet al servidor directamente, enviando queries por correo electrónico y más tarde con interfaces World Wide Web.El nombre archie viene de la palabra inglesa "archive", pero también está asociado con la serie de tebeos americana “Archie”.

Esta no era la intención original, pero fue lo que actuó como inspiración para los nombres de Jughead (oficialmente acrónimo de Jonzy's Universal Gopher Hierarchy Excavation And Display) y Verónica (acrónimo de "Very Easy Rodent-Oriented Net-wide Index to Computer Archives" ), ambos sistemas de búsqueda para del protocolo Gopher.Con la aparición del World Wide Web la búsqueda de archivos se simplificó mucho, y actualmente hay muy pocos servidores activos. Se puede encontrar un gateway en Polonia y en Japón.

Polonia:http://archie.icm.edu.pl/archie-adv_eng.html
Japón:http://www.iij.ad.jp/public/archie-main.html

####GOPHER####

Gopher es un protocolo de búsqueda, recuperación y distribución de documentos diseñado para Internet. Su finalidad es actuar como una forma FTP anónimo mejorada, con elementos similares a los de World Wide Web. El funcionamiento del protocolo Gopher ofrece servicios no soportados por el Web y ofrece una jerarquía mucho más potente sobre la información almacenada en él. Su interface es a través de menús es muy adecuada a entornos de computación que dependen fuertemente de terminales remotos. Algunos consideran que es el mejor sistema para almacenar y hacer búsquedas en grandes bancos de información. Hay miles de servidores Gopher distribuidos por la red, es muy común ver que en universidades, hospitales, agencias gubernamentales, editoriales, disponen de su propio servidor de información tanto para uso interno como externo. Los items reseñados son: guías de internet, directorios de correo electrónico, una lista de servidores de FTP anónimo, máquinas que soportan grandes bases de datos, servidores de WAIS, directorio de listservers y de revistas electrónicas, etc...

Sobre gopher habría mucho más que decir, pero casi que otro ratico nos pondremos en profundización... y ¿por qué nos ha dado por este tema? pues porque ya lo teníamos hecho, estamos modificando la entrada de WAIS y la de ARCHIE de la wikipedia.