jueves, enero 25, 2007

PRIVACIDAD Y CENSURA EN INTERNET (I)

INTRODUCCIÓN


1. INTERNET

Internet se inicia en los años 60, en plena Guerra Fría, cuando EE.UU crea una red exclusivamente militar, para que en caso de que el ejército ruso atacase, poder acceder a la información militar desde cualquier punto del país. Esta red se llamó ARPANET. La red creció tanto que su sistema de comunicación se quedó obsoleto, por lo que se creó el Protocolo TCP/IP, el cual se convirtió en el estándar de comunicaciones. ARPANET dejó de tener uso militar y éste fue a parar a MILNET.

La NSF (Nacional Science Fundation), crea NSFNET que más tarde absorbe ARPANET, creando el embrión de lo que hoy conocemos como Internet. En Suiza, en el Centro Europeo de Investigaciones Nucleares, Beners Lee retomó la idea del hipervínculo, del que ya se había hablado antes y fue en 1990 cuando se le dio nombre a este sistema de vínculos de información a través de redes.

En 1993, se crea la primera versión de MOSAIC, que permitió acceder con mayor naturalidad a la WWW. Poco después se creó el programa NETSCAPE. A partir de entonces Internet a crecido a una gran velocidad, lo que hace que toda la información que alberga tenga que estar ordenada y clasificada de alguna manera, aquí entran en juego los motores de búsqueda o Robots de la web.


2. LA EVOLUCIÓN DE LOS MOTORES DE BÚSQUEDA

Enunciaremos diversos buscadores, quizá los de mayor importancia y alcance, clasificados por fechas de aparición, desde 1994 hasta 2006.

1994

WEBCRAWLER
Nació a principios de 1994, como un proyecto universitario, en la Universidad de Washington (EE.UU.) Su creador, Brian Pinkerton vendió el Motor de Búsqueda a AOL a mediados de 1995 el cual a fines de 1996 fue adquirido por Excite!.
A pesar de pertenecer a Excite! su funcionamiento es totalmente independiente. WebCrawler, fue el primer Motor de Búsqueda en crear y utilizar el estándar de exclusión de Robots o Spiders, el cual será analizado más adelante.

LYCOS
Fundado en Enero de 1994, y lanzado en Internet en Junio del mismo año. Al igual que otros Motores de Búsqueda, Lycos nació como proyecto de Investigación de la Universidad de Carnegie Mellon por el Dr. Michael Mauldin. Lycos fue la primera empresa en Internet en basar su publicidad en CPM (costo por miles de visualizaciones) la cual es actualmente un estándar en la industria de Internet.
También incluyó en su base al directorio ODP (Open Directory Project, el directorio de sitios del World Wide Web más grande, organizado en categorías y totalmente construido de forma manual, por usuarios de Internet. Más adelante se presenta al ODP con mayor detalle).

EXCITE!
Fundado por Mark Van Haren, Ryan McIntyre, Ben Lutch, Joe Kraus, Graham Spencer y Martin Reinfried.
Ofrece búsquedas basadas en palabras claves o basadas en conceptos (no sólo buscando los términos deseados por el usuario sino también los similares).
También Excite! provee una interesante forma de alineación de páginas dinámicas para diferentes sistemas operativos.

1995

ALTAVISTA
Nació en Abril de 1995, en los Laboratorios de Digital Equipment Corp. (DEC Research) en Palo Alto, California, EE.UU. Sus dueños actuales son COMPAQ y CMGI Inc.
La innovación más notable de este Motor de Búsqueda, fue la inclusión de búsqueda multi lengua en Internet, siendo el primero en soportar chino, japonés y coreano utilizando los servicios del traductor Babel Fish (Primer traductor en línea en Internet). Otra de las innovaciones presentadas por este Motor, fue la de permitir búsquedas multimedia, para explorar Internet por fotografías, videos y música, estimados en aquel momento en más de 90 millones de objetos.

YAHOO
Es principalmente un directorio Web y no un verdadero Motor de Búsqueda. Por lo tanto, su estructura está basada en sitios Web propuestos por usuarios y no por los encontrados por un Robot o Spider.
Creado por David Filo y Jerry Yang, Ingenieros Eléctricos de la Universidad de Stanford, comenzaron su catálogo en Abril de 1994, para mantener y rastrear los sitios de su propio interés.
Su lanzamiento en Internet fue en Agosto de 1994. Yahoo! es el portal favorito de muchos usuarios de Internet. A pesar de ello, en el último año, agregó servicios alternativos como chat, Correo Electrónico gratis, hosting y la posibilidad de crear comunidades virtuales. El Motor de Búsqueda de Yahoo fue Google hasta Febero de 2004. Actualmente Yahoo usa su propio motor de búsqueda el cual esta basado en Inktomi (buscador que adquirió en Marzo de 2003) y basado también en Altavista y en AllTheWeb.

1996/1997

INKTOMI
Deriva de un Motor de Búsqueda desarrollado por la Universidad de Berkeley, California, EE.UU. Fue fundado en 1996 por dos estudiantes de dicha Universidad, llamados Eric Brewer y Paul Gauthier.
Provee servicio de búsqueda a una importante legión de empresas de la web como: HotBot, AOL, ICQ, GeoCities, Search MSN, GoTo, Canada.com, RadarUol, entre otros.
Inktomi no sólo es conocido por su potente Motor de Búsqueda, sino también por lograr la confección de directorios utilizando las páginas obtenidas por su Spider.

GOOGLE
Al igual que la mayoría de los Motores de Búsqueda de Internet, nació como un proyecto de investigación universitaria de dos alumnos: Sergey Brin y Larry Page. Fue en la Universidad de Stanford, EE.UU. en 1997.
En marzo del 2000, innovó el mercado de Motores de Búsqueda con su algoritmo PageRank, siendo usado por primera vez en el proyecto Open Directory. Dicho algoritmo, convirtió a Google en uno de los Buscadores más efectivos del mercado, utilizando dicho sistema. El sistema llamado PageRank, permite a Google filtrar una gran porción de resultados irrelevantes. Este sistema identifica cuántas páginas apuntan a una página en particular para poder así decidir cuáles son las páginas más relevantes. También su arquitectura innova el mercado diferenciando sitios Educativos y Gubernamentales de los sitios Comerciales, los cuales, tienden a utilizar spam contra los Motores de Búsqueda.

FAST
El Motor de Búsqueda Fast Search & Transfer, conocido como FAST o como AllTheWeb.com, fue creado en la Universidad de Ciencia y Tecnología de Noruega (NTNU) en Julio de 1997. Su dueño y administrador es Fast Search & Transfer ASA Technologies y fue lanzado a Internet a mediados de 1998; posee una de las bases de datos más grandes de la actualidad. Su sostén principal ha sido la búsqueda especifica de multimedia.
DIRECTHIT
1. Contabiliza los clics que realizan los usuarios en otros motores de búsqueda de los resultados que ven.
2. En conclusión cuanto más veces se visita un sitio, mejor es su posición en la clasificación.

TEOMA
1. Incorpora un servicio avanzado de búsqueda con este sistema podemos acotar nuestras búsquedas por idioma, área geográfica, dominio o fecha de incorporación a la base de datos del buscador.
2. Calcula la relevancia de una página analizando los hipervínculos para identificar comunidades en Internet, determinando cuáles son las autoridades, encontrando así las mejores páginas.

MSN SEARCH
1. Se creó de la mano de Microsoft, utilizando los datos de Inktomi.
2. Msn ha llevado a cabo esta modificación para mejorar su sistema de búsqueda e incluir en él varios enlaces a sus principales servicios, como Hotmail, Messenger o Noticias.

1998

OPEN DIRECTORY PROJECT
Es el directorio más grande de la web. Construido y mantenido por voluntarios (editores), organiza pequeñas partes de la red para descartar los sitios de contenido pobre y quedarse sólo con los más relevantes. Además provee información a diferentes motores de búsqueda: NetScape Search, AOL Search, Google, Lycos, Hotbot, DirectHit…

1999

BAIDU
Motor de búsqueda chino, visto en muchos casos como punto de referencia (hasta la actualidad) debido a la presión que mantiene el gobierno chino sobre Internet. La mayor parte de la inversión que tiene viene dada de empresas estadounidenses.

2000/2005

NUTCH
Es un motor de búsqueda con Código abierto, creado en JAVA.

CLUSTY
Filosofía basada en el clustering (conjunto de ordenadores que comparten un mismo hardware).
Fue el primer buscador que ofrecía búsquedas en Blogs o la Wikipedia en una de sus opciones.

NOXTRUM
Enfocado a sitios en castellano y portugués. Contiene toda la información de Páginas Amarillas

2006

QUAERO
Buscador europeo impulsado, principalmente, por los gobiernos de Francia y Alemania (que ha abandonado el proyecto 21- diciembre 2006 por diferencias de opinión con Francia sobre la estructura y contenido del buscador) y potenciado por grandes empresas tecnológicas europeas como como Thomson, France Telecom
Se lanza como EXALEAD (Buscador que llevaba años en funcionamiento con los resultados de AOL y tras el acuerdo de éste último con Google, decidió usar el índice de Quaero)
Índice de 8.000 millones de resultados y es compatible con cualquier navegador.
Además de áste tenemos: Snap, Live, Hakia, Powerset, Cranky y Retrevo. De éstos últimos ya hablamos en un post anterior.

No hay comentarios: