La Web como memoria organizada: el hipocampo colectivo de la red

Enviado por Javier Candeira

Este artículo -que sinDominio reproduce aquí con el amable permiso de su autor- apareció formando parte de la recopilación "Para poder pensar", publicado en la Revista de Occidente (Madrid), en marzo del 2001. La revista presentaba el siguiente Índice:

Para poder pensar. Encuentro, creación y transmisión en la Red", por José Antonio Millán

Cómo podríamos pensar", por Vannevar Bush

"En el comienzo era el rumor", por Roberto Blatt

"¿Muerte o transfiguración del lector?", por Roger Chartier

"La Web como memoria organizada: el hipocampo colectivo de la red", por Javier Candeira

Sobre los autores

"La diferencia entre información y conocimiento es la siguiente:

– información es cuando tienes el número de teléfono de Christie Turlington;

– conocimiento es cuando tienes a Christie Turlington [1]

P.J. O’RourkeAge and Guile Will Beat Youth, Innocence And A Bad Haircut

Introducción: The Knowledge

La primavera pasada, una noticia recogida por la BBC llamó mi atención. Científicos del London University College habían descubierto que los cerebros de los taxistas londinenses tenían el hipocampo más grande que los de las personas que no conducían taxis por Londres. No sólo lo tenían más grande (de media, que se dice en estos casos) como colectivo; el crecimiento del hipocampo era más acusado en aquellos profesionales que llevaban más tiempo en el oficio. Ser taxista en Londres hace que le crezca a uno el hipocampo, vaya.

La causa de este crecimiento se atribuye al hecho de que para obtener la licencia, un taxista ha de conocer de memoria el intrincado callejero londinense, también conocido como The Knowledge [3] El Conocimiento, con K mayúscula. El Conocimiento por antonomasia. Extraer una primera conclusión es tan fácil como castizo: el saber sí que ocupa lugar, después de todo. Lo que los científicos británicos deducen es más complejo: el hipocampo, lugar del cerebro donde los neurólogos sospechan que puede residir la coordinación de la memoria, crece según aumenta la capacidad del individuo de navegar por su entorno.

No se trata de una simple memoria literal; la capacidad de recordar está tan entrecruzada y relacionada como posibles rutas hay entre dos puntos cualesquiera de una metrópolis. Se diría que el nombre dado al callejero es especialmente apropiado, porque lo que almacenan los cerebros humanos no es información, sino conocimiento. Y el hipocampo es, según parece demostrar el experimento londinense, lo que nos hace capaz de recordar y navegar por nuestro entorno, gracias al conocimiento adquirido a través de la experiencia.

En su libro El arte de la memoria, (Taurus, 1974), Frances Yates describe la mnemotécnica griega como una ciencia hermética, en la que cada idea o concepto se asocia a una habitación de un edificio, el Palacio de la Memoria. El origen de esta técnica se atribuye al poeta griego Simónides, pero su escuela se puede rastrear hasta el Renacimiento a través de Cicerón, Santo Tomás de Aquino y Giordano Bruno. Los novatos en este arte de recordar basaban sus palacios en edificios reales, pero los maestros podían inventar espacios artificiales, llenos de alcobas y nichos en los que depositar sus recuerdos. Que esta técnica, arte o ciencia de la memoria tenga una utilidad real es muy revelador: en el cerebro humano los recuerdos y la capacidad de visualización espacial están relacionados de una forma que permite recuperarlos a voluntad.

El título de este artículo es una metáfora inspirada por el descubrimiento londinense. Pido de antemano disculpas a los neurofisiólogos que, con el vello del cogote erizado, estén en este momento dejando caer su ejemplar de la Revista de Occidente y corriendo hacia sus escritorios para componer una bien mesurada pero enérgica carta de protesta al editor. No sé si Internet se parece más al hipocampo que a la hipófisis, o al menos no estoy muy seguro. Pero estoy convencido de que Internet actúa como un sistema nervioso de orden superior, que interconecta y coordina operaciones en las que la voz de la colmena es más eficiente, más cierta, más afortunada que la voz de cada uno de sus individuos.

Si el mundo está, como vislumbraba Teilhard de Chardin, recubierto de una noosfera, una capa de materia pensante con una conciencia propia, la Internet es el sistema nervioso artificial que nos permite pensar como una comunidad, con facultades que superan a la de cada una de sus partes, sea cualitativa o cuantitativamente. Esas partes que integran la noosfera somos nosotros, y la Web es nuestro hipocampo colectivo, la sede de nuestra común memoria y capacidad de asociación, navegación y filtrado. Teilhard de Chardin habría dicho que la evolución humana culmina en una evolución cultural y tecnológica, que se encarna en un órgano cerebral externo.

Propuesta la tesis, entremos en la exposición

Los weblogs o diarios de ideas

Una forma muy conveniente de organizar la memoria es mediante las narrativas. Todos recurrimos a ellas en alguna ocasión: no encontramos las llaves y tratamos de recomponer la secuencia de acciones entre la entrada en la casa y el primer recuerdo consciente de haber extraviado el llavero. Esta es también una de las muchas funciones de los weblogs, o por lo menos una de sus utilidades.

Un weblog es, esencialmente, una colección de enlaces (URLs) anotados. Su nombre, traducido literalmente, significa "bitácora de la web", y de hecho gran número de webloggers de habla hispana llaman "bitácoras" a sus páginas. Existen muchos tipos de weblogs, pero en este artículo sólo nos ocuparemos de dos de sus acepciones más extremas. La primera es la definición que el estadounidense Peter Merholz hace de Peterme [5, su sitio personal en la red. Merholz opina que la principal función de una bitácora de red es servir de "diario de ideas" [6, una especie de autobiografía intelectual altamente informal y extemporánea, escrita con la doble intención de provocar el diálogo y servir de depósito para el pensamiento

Los webloggers como Merholz son un ejemplo de lo que el visionario Vannevar Bush describió llamó trail blazers, literalmente "abridores de sendas". En su influyente artículo de 1945 As We May Think [que se reimprime en este mismo número, N. del Ed.], Bush describía una dispositivo mecánico similar al hipertexto actual, y predecía la existencia de personas cuya función sería bucear en los vastos océanos de información y enhebrar un documento con otro, dejando una estela de significado entre las olas de ruido, contradicción y redundancia. Merholz y los webloggers como él son estas personas; la lectura de peterme.com es más que recomendada para quienes se interesen por el diseño de interfaz orientado al usuario, la crítica de cómics, la teoría de sistemas, el origen etimológico de ciertos términos sexuales o la naturaleza de los propios weblogs, entre otros muchos temas

La mejor forma de investigar en Internet sobre un tema es buscar alguien que ya lo haya hecho y publique la información al respecto. Los weblogs no pretenden ser directorios sistemáticos: se parecen más a un rastro de miguitas de pan dejado por una hormiga con suerte. Y la naturaleza temporal de los weblogs (el propio Merholz señala que "lo único se puede decir de todos los weblogs es que son cronológicos") hace que la memoria narrativa sea la mejor forma de recuperar una lectura medio recordada. "¿Dónde leí esto?", se pregunta uno rascándose la cabeza como hace cuando no logra encontrar las llaves. "Estaba antes de una cita sobre Sim City y después una referencia a los libros de ciencia cognitiva de la editorial del MIT. ¡Ah, sí! ¡En Peterme!". Nótese que ese "antes y después" puede referirse a la línea temporal del propio navegante de Internet, según sigue el rastro de enlaces. Pero esto no importa, al menos por ahora.

Está claro que hay gente con una voz propia que nos produce confianza, y que podemos identificar claramente, y orientarnos en su narración según nuestra necesidad. Pero esto siempre ha sucedido, los individuos siempre han tenido su voz, y los individuos singulares a menudo han tenido su audiencia. Particularmente, me gusta la voz en la que Peter Merholz compone su weblog. Pero se da una curiosa paradoja

Tomemos dos millones de americanos al azar, mejor que sean dos millones y medio para que se acerquen más al 1% aproximado de la población, y démosles acceso a Internet si aún no lo tienen, y enseñémosles a usarla. Es casi seguro que entre esos dos millones y medio de personas sepan más que Peter Merholz de casi cualquier tema, incluídos los temas en los que Merholz es especialista, sea por profesión o por afición. El problema es cómo se extrae una voz inteligible de esa multitud: dos millones y medio de personas no tienen una voz, lo que tienen es una barahúndaAquí es donde entra en juego lo que la jerga informática (animada y patrocinada por el espíritu del marketing) llama "filtrado colaborativo".

El filtrado colaborativo: la voz de la colmena

En los años 60 empezó a utilizarse por parte de gobiernos, instituciones internacionales y grandes empresas un método de prospectiva llamado "método Delphi", en referencia al oráculo griego de Delfos. Creado en 1953 por dos investigadores de la corporación RAND para dar solución a un problema de planificación militar, el método Delphi es el más popular de los sistemas para recabar y refinar las opiniones de un grupo de personas, normalmente un comité de expertos. El método Delphi, sin embargo, tiene un grave defecto: exige que los expertos estén informados del problema en cuestión, requiere que les sea repartido un cuestionario, y sólo es fiable si los expertos están dispuestos a colaborar.

Nada nos hace pensar que nuestros dos millones y medio de personas elegidas al azar cumplan estas condiciones, pese a estar provistos de ese gran elemento socializador que es el acceso a Internet. No sólo no son expertos previamente seleccionados, sino que la información que emiten es producto tan sólo de la intersección entre sus necesidades, sus conocimientos y su libre albedrío. Algunos están locos. Otros mienten. Gran cantidad de ellos creen a pies juntillas en lugares comunes, mitos urbanos o "verdades" procedentes de la superstición o las creencias religiosas más disparatadas. Dada cualquier pregunta cuya respuesta no sea claramente obvia ("¿Hay luz durante el día?"), aproximadamente la mitad de nuestros seleccionados contradice a la otra mitad. De hecho, una mitad contradice a la otra de forma espontánea, sin que medie pregunta previa

Y, sin embargo, sigo afirmando que estos dos millones y medio de personas no sólo saben más de casi cualquier tema que cualquier experto elegido arbitrariamente, sino que Internet nos provee de mecanismos para extraer conocimiento válido de esa grande y ruidosa confusión.

El más notorio experimento de "filtrado colaborativo", y el que dio origen al término, es Firefly, el sistema de recomendaciones gestado en el Instituto Tecnológico de Massachusetts por Patti Maes [7]. Este sistema, que en sus principios todavía recibía el nombre de "agente de software", resolvía el problema de la falta de coordinación de la masa… coordinándola. Al registrarse, el usuario tenía que responder a una serie de preguntas sobre sus gustos musicales, comparando unos discos y artistas con otros y puntuándolos en una escala numérica. Tras ese primer "entrenamiento", el "agente" era capaz de recomendarnos nuevos discos basándose en los gustos de los demás usuarios del sistema.

El sistema fue un fracaso comercial, y como "usuario" puedo decir que entiendo por qué. Firefly tenía una nefasta tendencia a dar datos sin aportar información. Lo cual, traducido al español que se habla en Occidente, significa que no contaba nada nuevo. Las recomendaciones eran siempre obvias, sin nada de la gracia que tiene cualquier desconocido que nos recomienda un disco tras una breve conversación. Y para ese viaje no hacen falta alforjas, que en este caso son el registro previo y el tercer grado inicial.

Un sistema similar con mejores resultados es el que tienen los grandes almacenes online Amazon, antes conocidos como librería online Amazon [8].

Si consultamos la ficha de un libro cualquiera, por ejemplo The Art of Memory, de Frances Yates, el sistema nos informa de otros libros que han comprado los clientes que se llevaron el título consultadoThe Memory Palace of Matteo Ricci by Jonathan D. Spence
Giordano Bruno and the Hermetic Tradition by Frances A. Yates
In the Palaces of Memory: How We Build the Worlds Inside Our Heads by George Johnson
The Rosicrucian Enlightenment by Frances A. Yates

La selección parece bastante obvia, son dos libros más de la misma autora y dos libros con el mismo tema que el que provoca la búsqueda, hasta el punto de que comparten un par de palabras-clave (memory y palace). Este sistema no nos propone nada que no hubiéramos encontrado por cuenta propia, sin más que dar los pasos lógicos. Sin embargo el sistema de Amazon tiene ya una ventaja clara sobre el Firefly de Maes: trabaja con información implícita, y no requiere que sus clientes se sometan a cuestionarios. "Masajeando" la base de datos que contiene la información de sus clientes (y sin romper su anonimato), Amazon puede ofrecernos recomendaciones basadas en datos reales. Es posible engañar a un sistema ante preguntas que no requieren ningún compromiso, y los algoritmos de Firefly quizá confíen demasiado en que la gente no vaya a mentir al contestar a su cuestionario previo. En la expresión popular norteamericana, los clientes de Amazon "votan con su dinero", con lo que se supone que su compromiso con las decisiones que toman es más sincero

Pero además Amazon parece funcionar mejor que Firefly. Podría ser una cuestión de mi imaginación, o puede que sea un efecto de cómo la acumulación de datos cuantitativos (Amazon es, con diferencia, el primer vendedor de productos culturales en la red) produce datos cualitativos. También podría ser que, pese a no haberlos inventado, los programadores de Amazon hayan sabido refinar mejor que Pattie Maes sus algoritmos de filtrado colaborativo. Existe una última posibilidad, y es que, por las características comerciales de los respectivos mercados o por la naturaleza de sus contenidos, los libros se presten más que la música a la selección automática este tipo de algoritmos. El caso es que, en ocasiones, Amazon nos sorprende con recomendaciones tan acertadas como inesperadas.

Introduzcamos, por ejemplo, el título Systemantics: The Underground Text Of Systems Lore, un libro, por cierto, que viene muy bien recomendado por Peter Merholz. Estas son las sugerencias que hace Amazon, basadas en las compras de otros clientes·

The Logic of Failure by Dietrich Dorner, et al.
Living on the Fault Line : Managing for Shareholder Value in the Age of the Internet by Geoffrey A. Moore
Patterns of Software : Tales from the Software Community by Richard P. Gabriel
Humane Interface, The: New Directions for Designing Interactive Systems by Jef Raskin

Interesante: uno de los libros viene firmado por Jef Raskin, iniciador del proyecto Macintosh en Apple. Otro de ellos es obra de Geoffrey Moore, un gran teórico sobre el desarrollo comercial de la tecnología. No conozco a los otros dos autores, pero los títulos me atraen, el primero (La lógica del fracaso/fallo) porque me sugiere que es una teoría general de "por qué las cosas no salen bien", algo que ha intrigado al alma humana desde el desgraciado incidente de la serpiente y el arbol plantado en el centro del Eden, y el segundo porque me parece interesante el posible enfoque antropológico, o de historia oral, del estudio de los patrones o pautas en la ingeniería del software. Sobre todo, ninguno de los títulos ni los autores, con la posible excepción de The Logic of Failure, habría aparecido en una búsqueda superficial por palabras-clave más o menos obvias. En cualquier caso, esta vez Amazon ha acertado conmigo, o yo con Amazon. Quizá fuera bueno que experimentaran ustedes, y llegaran a sus propias conclusiones.

Pero recabar votaciones involuntarias o "implícitas" es mucho más fácil todavía, y mucho más útil de una manera cotidiana y prosaica. Un ejemplo concreto: ¿Cómo se escribe, Gutenberg o Gutemberg? Introduzco ambas variantes en Altavista[9], un buscador de texto completo, y me fabrico una concordancia instantánea en dos pasos:

Gutemberg: 4,315 pages found
Gutenberg: 119,275 pages found

La votación no es menos arrasadora por implícita. Los autores de las 123.590 páginas indizadas por Altavista no están respondiendo a la pregunta "¿Cuál es la grafía correcta del nombre del inventor de la imprenta de tipo móvil?" más que de forma implícita, pero los resultados son igualmente válidos. Yo me dejo llevar por el consenso, y no creo que los 4.315 heterodoxos (o menos, algún autor puede haber confeccionado más de una página) sean de mucho fiar.

Sería fácil escribir una pequeña aplicación que aceptara dos o más términos (ni siquiera tienen por que ser grafías alternativas de una misma palabra), comprobara su frecuencia de aparición en la base de datos de Altavista o cualquier otro buscador y ordenara los resultados en orden creciente o decreciente. Pero lo más importante es que, al igual que en el ejemplo de Amazon, la información se "cosecha" de entre los datos que voluntariamente hacen públicos sus emisores, sea al hacer sus compras o publicar sus páginas web. Nuestro proceso de recolección y refinamiento de la información no requiere esfuerzo extra por parte de sus emisores, no exige su atención.

El economista Michael Goldhaber postula que en la era de la creación y transmisión digital de los canales y los contenidos que los llenan, el recurso escaso es nuestra atención. El contenido es multiplicable hasta el infinito, mientras que la atención es indivisible, y el tiempo del que disponemos es el auténtico recurso escaso. Esta escasez es la que crea una "nueva economía natural de la red", que Goldhaber llama "La Economía de la Atención" (nota)[10] según la definición que dice que la economía es el arte de la optimización de los recursos escasos, y valiosos, y que en la sociedad de la información la atención no sólo es escasa, sino valiosa en términos que se pueden contabilizar.

Nuestros mecanismos de filtrado colaborativo, el de Amazon y el sistema casero de comprobación de ortografía, que les recomiendo que se tomen con una buena dosis de caveat emptor, tienen a su favor que, en términos de atención, son gratuitos para los proveedores de la información, y de muy bajo precio para los consumidores, en el caso de Amazon.

Sin embargo hay casos en los que los proveedores de la información son también sus consumidores, y como tales están dispuestos a "gastar" un poco de su atención para mejorar la calidad de la información que consumen. Esta calidad se mide en algo que, por analogía con la ingeniería de telecomunicaciones, llamaremos "señal/ruido". Entre otros términos.

Dos millones y medio de tecno-freaks, todos opinando al mismo tiempo

Slashdot[11] es un sitio de noticias sobre software libre, ciencia, política digital y derechos civiles, tecnología y hardware, Linux y Unix en general, Legos, Star Wars… la lista exhaustiva de temas es demasiado larga para este artículo. El sitio se autodefine con el lema News for Nerds. Stuff that Matters, lo que traducido libremente viene a decir algo así como "Noticias para empollones. Cosas que importan".[12]

Slashdot es un weblog colaborativo y automoderado, en el que los lectores son los que proponen y escriben la mayor parte de las "historias" o noticias, y también pueden comentarlas mediante un sistema que no sonará a nuevo a quienes ya estén familiarizados con este tipo de foros electrónicos. El lector que desee hacer un comentario puede introducirlo en el sistema, sea como respuesta a la noticia principal, o como glosa a otro comentario anterior. El resultado es una estructura arborescente de comentarios a comentarios a comentarios, que dirían Gertrude Stein o Jonathan Swift. Las líneas de discusión que unen una secuencia de comentarios a comentarios se llaman "hilos" o "threads", y terminan (o, mejor dicho, empiezan) necesariamente en una noticia. (nota)[13]

Hemos dicho que Slashdot es un weblog colaborativo y automoderado.Veamos qué significa eso. Si un weblog es, según nuestra anterior definición, una lista cronológica de enlaces comentados, el aspecto colaborativo de Slashdot lo aporta el hecho de que cualquier lector puede proponer su enlace junto con su comentario. En este sentido los autores de Slashdot son sus lectores desde la primera iniciativa. Pero si esto fuera todo, Slashdot y los sitios de su mismo estilo no se diferenciarían en nada de un tablón de corcho en la pared de un instituto, o en las paredes de un urinario público.

Cualquiera puede proponer una noticia mediante el formulario habilitado al efecto, y hacerlo anónimamente (protegido si quiere por un apodo autoescogido). Pero la portada de Slashdot o de cualquiera de sus secciones se compone de una selección de las noticias propuestas. Los encargados de esta selección son los llamados editores, que lo son en el sentido que en el mundo de la edición anglosajona recibe la palabra editor: seleccionan, refinan, corrigen, comentan y (en ocasiones) recortan las noticias propuestas antes de publicarlas.

Hasta aquí el proceso es similar al de publicación en las cartas al director de un periódico. Pero en este momento es donde entra en funcionamiento el verdadero corazón de Slashdot. Los lectores empiezan a poner sus comentarios. Al contrario que en la mayor parte de los foros albergados por medios de comunicación tradicionales, aquí los temas han sido propuestos por los propios lectores. Al contrario que en las cartas al director de los medios impresos, en los que el único que responde al lector es, en ocasiones, el redactor jefe, aquí todos se pueden responder entre sí. La calidad de los comentarios es fundamental. Entre los usuarios de Barrapunto [14], el sitio inspirado en Slashdot que co-mantengo, existe el consenso de que el valor de un sitio como Slashdot no reside en las noticias, sino en los comentarios de sus usuarios [15].

El resultado es una estupenda cacofonía libertaria de opiniones y contra-opiniones, datos informativos, mentiras y rumores, chistes, momentos de inspiración, comentarios que no vienen al caso, flames y trolls. Estos tres últimos tipos merecen su explicación aparte, pues son el motivo histórico que dio origen al sistema de moderación. Un flame es un insulto, una diatriba que se sale del tono de la discusión sin contribuir al debate. Los foros de discusión online aceptan bien la ironía, e incluso el sarcasmo, pero el insulto personal o el desbarre fóbico están muy mal vistos. Un troll es un comentario provocador, a menudo en busca de que alguien responda con un flame. Un comentario que no viene al caso es simplemente eso, y los tres ejemplos, trolls, flames y offtopics tienden a generar ruido en la discusión. En los términos de la metáfora telemática antes citada, la relación señal/ruido empeora, y el debate es menos fructífero, o menos inteligible.

Históricamente, Slashdot empezó como una página personal. Su creador Rob Malda, alias "CmdrTaco" y un amigo llamado Jeff Bates, alias "hemos", colgaban en su web las noticias que les interesaban, y abrían el foro al debate público. Pronto Slashdot se hizo popular entre universitarios aficionados a la informática sobre Linux y a la política del Software Libre. Demasiado popular, incluso, y pronto los debates estaban llenos de comentarios como "First Post!" (¡Primer comentario!") o "Quiero untar a Natalie Portman de gachas calientes etc…". Incluso los comentarios que iban al grano se repetían, mejorando la relación señal/ruido en términos estadísticos, pero disminuyendo la concentración de información disponible. Este último ejemplo es comparable a las ocasiones en que dictamos un número de teléfono dos veces en un contestador. En este caso la redundancia ayuda a la comunicación, pero la concentración de información por unidad de tiempo es menor.

La historia de cómo Malda fue experimentando con distintos modelos de moderación está muy bien contada por él mismo[16]. Nosotros nos contentaremos con describir la moderación en su estado actual (octubre de 2000).

Como ya hemos dicho, cualquier lector puede proponer una noticia. Para que esta noticia aparezca en la portada, es necesario que un editor la publique. Una vez publicada una noticia, cualquier lector puede añadir su comentario. Hasta aquí, todo es sencillo.

Malda añadió al sistema un mecanismo cualitativo y cuantitativo de puntuación de comentarios. Cada comentario puede tener entre -1 y 5 puntos, y una calificación adjetiva (interesante, offtopic, gracioso, troll, informativo, sobrevalorado). El lector de Slashdot puede elegir qué comentarios lee seleccionando el umbral de corte. Quien quiera saber lo que es un troll no tiene más que leer Slashdot con la moderación a -1. Quien quiere leer sobre un tema y no tiene mucho tiempo puede hacerlo con el umbral puesto a 5, con lo cual sólo leerá los mejores comentarios, aquellos que han alcanzado la puntuación más alta. Pero lo interesante no es cómo los lectores usan el resultado de la moderación, sino cómo la ejecutan sin ningún tipo de supervisión por parte de los editores.

Para ser moderador es necesario ser usuario registrado. Esta condición es evidente, puesto que la idea de la moderación es que entre todos los lectores de Slashdot extraigamos la voz comunal del sitio, y la navegación anónima no permite saber si un visitante forma o no parte de la comunidad. Así que los "Anonymous Cowards" o "Pendejos sin Nombre" (terminología de Barrapunto), apodo que reciben los contribuyentes anónimos, pueden proponer noticias para su aprobación por un editor y comentar libremente las que pasan ese primer filtro, pero no tienen la capacidad de moderar. Podemos decir que poner comentarios es un derecho, pero moderarlos es un privilegio acordado sólo a ciertos miembros de la comunidad.

Periódicamente, el sistema informático que genera las páginas HTML de Slashdot y controla su base de datos ejecuta un programa que cuenta el número de noticias y comentarios, y evalúa el número de puntos de moderación necesarios para calificarlos. Una lotería reparte esos puntos (en lotes de 5) entre los usuarios registrados que visitan el sitio, según un baremo especial. Los visitantes poco asiduos están descontados, porque se supone que no conocen lo bastante bien el espíritu del sitio, y no lo pueden representar. Los visitantes más frecuentes son gente que tiene "demasiado tiempo libre", y Malda no los considera fiables: el moderador ideal está en el punto medio.

Existen más mecanismos de control que aseguran que la moderación escoja los mejores comentarios. Para evitar que alguien pueda "ahorrar" sus puntos hasta que se toque un tema en el que esté personalmente involucrado, y modere arrimando el ascua a su sardina en lugar de elegir los comentarios que más contribuyen al debate, los puntos caducan a los tres días. Si no se usan, se pierden. También es imposible moderar comentarios de una noticia que uno mismo haya comentado. O se comenta, o se modera, pero no se pueden hacer las dos cosas en la misma noticia. De este modo se evita que alguen pueda darle sus puntos a su propio comentario, o a un comentario con el que simplemente esté de acuerdo, sin importarle la calidad que pueda aportar al discurso.

Cada acto de moderación tiene también, como hemos dicho, un componente cualitativo. No sólo otorgamos o restamos un punto al comentario, también decimos por qué lo hacemos. Si decimos que un comentario es gracioso, interesante, informativo o infravalorado en relación con los demás, le añadiremos un punto que se restará de nuestra cuenta. Si nuestra calificación es de redundante, troll, sobrevalorado o fuera del tema, le restaremos un punto de los que tenemos para moderar. Ningún comentario puede tener más de 5 puntos, ni menos de -1. No tiene sentido moderar hacia arriba un comentario calificado con un 5, ni hacia abajo un -1 troll.

Esto funciona especialmente bien a la hora de usar los parámetros de moderación como lector. Un troll es un troll en cualquier forma en que aparezca, y a no ser que uno tenga un sentido del humor particularmente inmaduro, leer Slashdot asignando -1 al umbral de moderación es un acto que oscila entre la curiosidad malsana y el puro masoquismo.

Los comentarios ya nacen con un valor de moderación. Si quien los aporta es un usuario registrado, su valor es automáticamente igual a 1. Si son aportaciones anónimas (uno de los mayores contribuyentes a Slashdot se llama A. Nonymous y se apellida Coward) su valor inicial de moderación es cero. Esto incentiva la participación y el registro, y también da por hecho que la calidad de los comentarios es proporcional a la responsabilidad que uno sobre sus palabras. Es una lástima que en esta asignación de ceros puedan caer algunos justos con los pecadores (mucha gente considera necesario contribuir anónimamente, por lo común por razones laborales), pero en general el sistema incentiva el esfuerzo en redactar una nota que se ajuste al tema, sea informativa, no sea redundante y, a ser posible tenga algo de espíritu original.

¿Saben lo curioso? El sistema funciona. Un reciente estudio realizado por el holandés Johan Pouwelse con vistas a su doctorado en la Universidad de Delft calcula que el sistema de moderación identifica un comentario inspirado (insightful) en tan sólo 37 minutos[17]. Lo interesante del sistema es que cada moderador independiente dedica a la moderación mucho menos tiempo. De hecho, el acto de moderar está asociado a la lectura de los comentarios del sitio (algo que los moderadores hacen frecuentemente de todas formas, o el algoritmo de Malda no les adjudicaría los puntos de moderación), así que para un lector de Slashdot, el coste de moderar es, en términos de economía de la atención, prácticamente cero. Sin embargo, la suma (o debería decir mejor la integración, pues los elementos sumados se acercan a cero) de todos esos actos de moderación individuales produce un efecto macroscópico imposible de lograr por una sola persona.

Un individuo podría realizar esa moderación, pero a) tardaría más y b) moderaría menos cantidad de comentarios. La moderación de Slashdot se realiza en paralelo, y durante los 37 minutos que Powelse ha calculado que se tarda en que emerja un comentario inspirado, muchos otros comentarios flotan a la superficie por informativos, interesantes o graciosos, y otros tantos se hunden en los abismos del -1 por redundantes, alejados de la cuestión, insultones o simplemente por idiotas. El corazón de Slashdot funciona como un sistema nervioso de orden superior, que coordina todos estos minúsculos esfuerzos intelectuales (minúsculos cuando la métrica que aplicamos es la Economía de la Atención) para extraer de ellos opiniones colectivas, la voz de la comunidad de lectores de Slashdot.

Si consideramos que Slashdot es un repositorio de información y opinión (un análogo de la memoria externa), el sistema de moderación es un filtro distribuido, que en vez de residir en un solo programa está repartido por los ordenadores coloidales que cada lector guarda en su cabeza. Los comentarios moderados se almacenan en Slashdot, que a partir de este momento deja de almacenar mera información para convertirse en un repositorio de conocimiento, el resultado de una elaboración comunal de teorías, información, opiniones o narrativas. Un hipocampo colectivo, si me permite decirlo el único neurofisiólogo que todavía sigue leyendo

El sistema de moderación, sin embargo, tiene sus fallos. Los usuarios más activos (dentro de un orden) adquieren el privilegio de la moderación con mayor frecuencia, y tienen más mano en la evolución temática de cada debate, y por tanto pueden sesgar la identidad de Slashdot hacia su ideología. Por esa razón existe un sistema de meta-moderación.

Quid moderat ipsos moderatores?

La cibernética es la moderna ciencia del control en sistemas complejos, más concretamente del autocontrol en sistemas autoregulados. En 1948, cuando Norbert Wiener formuló su teoría, lo hizo basado en investigaciones de Arturo Rosenbluth, cardiólogo mexicano con el que colaboraba en el Instituto Nacional de Cardiología [18]. El descubrimiento de Wiener y Rosenbluth es que el corazón no está guiado por el sistema nervioso central, sino que se alimenta de las señales nerviosas que él mismo genera, en un proceso de realimentación o feedback. Así, mediante la realimentación, es como se autoregulan los sistemas complejos.

En Slashdot la realimentación se produce por un sistema llamado Meta-Moderación. A cada usuario registrado se le ofrece diariamente la posibilidad de juzgar una lista de diez decisiones de moderación, marcándolas como "justas" o "injustas" ("fair" y "unfair", respectivamente), o declarar la abstención. Lo que se juzga no es el comentario, sino el acto de moderar, y con ello y de forma implícita, la capacidad de cada moderador. Un meta-moderador puede encontrarse con varios comentarios repetidos (un comentario puede haber sido moderado por más de una persona), y juzgar cada decisión de moderación independientemente de si está de acuerdo con el comentario o no. Lo importante es declarar si este comentario contribuye a mejorar la calidad del debate.

Los moderadores que sistemáticamente reciban meta-moderaciones de "injusto" pueden perder la posibilidad de adquirir el estátus de moderación. Los moderadores que sistemáticamente reciben meta-moderaciones de "justo’ ganan unos puntos que Malda ha bautizado "Karma". Los usuarios con elevado Karma tienen más probabilidades de ganar la lotería de la moderación, además de un privilegio añadido: sus comentarios entran automáticamente con dos puntos, uno más que el que reciben los usuarios sin Karma.

Recapitulando, en Slashdot tenemos:

Propuestas de noticias, que cualquier visitante del sitio puede hacer, esté o no registrado.
Noticias, que son escritas por los editores, o seleccionadas de entre el corpus de propuestas enviadas por los contribuyentes.
Comentarios, que de nuevo puede poner cualquiera, pero que en el caso de los usuarios registrados que se identifican ante el sistema reciben de entrada el nivel 1 de interés.
Actos de moderación de comentarios, que son realizados por los usuarios registrados que reciben irregularmente el estátus de moderador.
Actos de meta-moderación, en los que cualquier usuario registrado puede juzgar diariamente diez decisiones realizadas por otros moderadores.

Apartándonos por un momento del tema de este artículo, la metáfora biológica-ciborg de Internet como cerebro colectivo, y utilizando un análisis político, podemos ver que el sistema de propuestas, noticias, comentarios, moderaciones y meta-moderaciones es un sistema jerárquico de democracias de distintos tipos:

Propuestas: libertad de expresión igual para todos, usuarios registrados o no.
Noticias: las noticias se deciden individualmente por miembros de una aristocracia, los editores, entre los que existe un consenso de opinión pero también una jerarquía, ya que algunos de los editores son los dueños del garito.
Comentarios: democracia asamblearia, libertad total de palabra. Es importante hacer notar que el sistema de moderación de Slashdot logra extraer el debate interesante del discurso caótico sin perjudicar el derecho a la libre expresión de sus contribuyentes. Cualquiera que lea Slashdot con la moderación a -1 verá que nada se borra ni se suprime. Lo que la moderación genera es un filtro, que los lectores pueden usar si así lo desean. Los gritos de "¡Censura!", cada vez más infrecuentes, son sólo pataletas sin justificación.
Moderación: es una democracia censataria (sólo pueden moderar los usuarios registrados que cumplen unas condiciones adicionales), modulada por una especie de "Lotería de Babilonia" de la que nos hablaba Borges.
Meta-Moderación: democracia censataria pura (todos los usuarios registrados pueden votar, sin ninguna condición adicional, con sólo identificarse).
Karma: concebido como una medida cuantitativa del valor de un individuo para la comunidad, el Karma puede interpretarse como un reconocimiento de prestigio. El sistema de Karma es una forma de meritocracia, en la que este prestigio se adquiere mediante el trabajo realizado en la comunidad (cuentan la cantidad y la calidad de los comentarios, moderaciones y meta-moderaciones). Este prestigio no sólo es cuantitativo, también se puede instrumentalizar; dado que el elevado Karma confiere una mayor probabilidad de acceder al estátus de moderador, este ciclo se realimenta positivamente, con lo que existen individuos con una gran cantidad de Karma que no deja de crecer.

Dejo a los lectores de Revista de Occidente aficionados a la política (o quizá me reserve yo para otro ensayo), el paralelismo entre el sistema de control editorial de Slashdot y el parlamentarismo bicameral con separación entre los poderes legislativo, ejecutivo y judicial.

Las actividades de meta-moderación sí que requieren un esfuerzo voluntario, y en ese sentido son más "caras" (siempre en término de economía de la atención) que las meras moderaciones. Los usuarios que meta-moderamos en Slashdot (porque me incluyo) lo hacemos con la idea de que así ayudamos a la calidad del discurso que recibimos, y que dado que el bien que producimos lo disftutamos todos, no hay una relación de proporción entre el esfuerzo y la recompensa. Un pequeño esfuerzo distribuido entre todos (la meta-moderación) produce una recompensa que todos compartimos (un sistema de moderación más justo, y con él una mayor calidad editorial del sitio) .[19]

No es casual que uno de los temas centrales de Slashdot sea el Software Libre. Esta dinámica económica de reparto de los esfuerzos y compartición de los resultados es una característica del desarrollo informático en el ámbito del software libre. En el campo de lo material sucede al revés, ya que el esfuerzo se puede compartir o repartir, pero la recompensa siempre se reparte. Pensemos en cuatro de amigos hambrientos una tarde de sábado. Da lo mismo que vayan todos juntos a comprar comida y que todos la cocinen, o que cada uno se encargue de una cosa. Ya se compartan o se repartan las tareas, el resultado siempre se repartirá, pues es imposible que los cuatro se coman un pollo entero si sólo hay un pollo. Esta interesante digresión podría dar lugar a todo un artículo sobre la economía del Software Libre, pero en realidad es una forma de pasar a nuestro siguiente punto.

Algo a cambio de casi nada: el filtro recursivo de votaciones implícitas

El mejor buscador de Internet que hay en este momento, sin ninguna duda, es Google.[20] Esta aseveración, que no sé si es una verdad objetiva o simplemente un consenso entre mis amigos y colegas, es decididamente mi opinión personal, adquirida tras cuatro años de pasar la tercera parte de mi horario laboral leyendo resultados de un buscador u otro.

El sistema que emplea Google para refinar sus búsquedas no es otro que nuestro viejo amigo el filtrado colaborativo, extraído de una información que los autores de los sitios web publican de forma implícita en sus páginas: los enlaces hipertextuales. Si en nuestro ejemplo de uso de Altavista como consejero ortográfico cada palabra es un voto por esa variante ortográfica, en Google cada enlace es una voto por la página a la que apunta. Este sistema no pillará por sorpresa a los lectores que conozcan el mundo académico, donde una de las métricas de calidad del trabajo que se realiza es el famoso y temible "citation index", el repertorio de citas que unos científicos hacen del trabajo de los demás, pero ordenado por receptores. Cada cita en un trabajo académico es un tributo, un respaldo al trabajo de un colega.

Un enlace, un voto. En esa gran votación constante que es la masa de hipertexo que compone la Web, cada decisión de enlazar es realizada por un humano que, enlace por enlace hipertextual, va expresando una opinión sobre la calidad de la información de destino. Esto no es nada nuevo como concepto: otros buscadores como Excite ya clasificaban las páginas web por un prodecimiento similar similar, pero se ve que lo hacían peor, porque los resultados de Google son espectacularmente más pertinentes. Según lo poco que revelan acerca de sus algoritmos los técnicos y directivos de la compañía, Google refina el método mediante un sistema de recursividad.

Las páginas que se consideran más valiosas son las más enlazadas, y Google concede distinto valor al texto que hay en el propio enlace y al texto que lo rodea. Pero un enlace que provenga de una página más valiosa es a su vez más valioso, en un bucle de realimentación positiva que refina los resultados. En cierto sentido, Google realiza el recorrido de seguir un enlace a otro, calculando el valor de cada bucle (A enlaza a B enlaza a C enlaza de nuevo a A) y realizando el mismo proceso que un esfuerzo de la memoria narrativa por seguir el discurso hipertextual.

En este proceso recursivo Google no sólo le ahorra esfuerzo al receptor de la información, a la persona que la busca; tampoco requiere del emisor que la publica ningún tipo de manipulación extra, ni la asignación de categorías temáticas como hacen los sistemas de recuperación documental por campos y claves. Quien hace una página web sólo tiene que enlazar a la página que le interese, y procurar ser lo bastante interesante y publicitarse bien para ser, a su vez, receptor de enlaces hipertextuales. En la maraña de referencias resultante, Google se encarga del resto.

Como en el ejemplo del software libre, cada uno aporta su poquito de información, su trozo de la maraña, y sin embargo todos disfrutamos del total. Se reparte el trabajo y se comparten sus frutos. Compárese con los directorios como Yahoo, donde cada sitio es evaluado por una persona para decidir en qué categoría hay que incluirlo, o cada editor ha de proponer la lista de palabras claves y categorías en las que quiere que aparezcan sus páginas.

Desde su lanzamiento sin pompa ni boato, Google ha ido capturando la atención de usuarios, analistas, inversores y empresarios. El último golpe de efecto ha sido la adopción de la tecnología Google por parte de Yahoo!, que al integrarlo en su sitio le dio el último espaldarazo que necesitaba. En España, el buscador Ariadna y el sistema interno de búsquedas del diario El Mundo también funcionan sobre Google, y la calidad de los resultados avala el buen nombre que tiene el buscador californiano.

Pero el argumento de autoridad del mercado no es lo que nos ocupa. Hay grandes éxitos empresariales basados en productos que son llanamente inadecuados. Google funciona porque incorpora la gran cantidad de conocimiento y experiencia expresados en los enlaces hipertextuales, y los manipula como tales, usando esa meta-información (información acerca de la propia información que almacena en su base de datos) para buscar más "inteligentemente" y dar mejores resultados. Por el contrario, Altavista no utiliza la información que su base de datos contiene sobre esa propia información, y el resultado es sólo información. Es el usuario el que tiene que hacer el esfuerzo mental de selección, y en ocasiones recorrer un número mayor de resultados para encontrar el dato buscado.

En este sentido Google tiene un gradiente de concentración de información: devuelve el mismo número de resultados que Altavista, pero los mejores están más cerca del principio de la tabla. Para robar otra metáfora, esta vez de las matemáticas, es como si Google elevara la información al cuadrado, aplicándosela a sí misma, y así extrayera migajas de conocimiento. Por retomar la cita que abre este ensayo, Altavista nos devuelve el número de teléfono de la información que estamos buscando, mientras que Google nos entrega directamente el objeto de nuestra búsqueda.

Apenas estamos comenzando a vislumbrar el potencial de estas tecnologías. Podemos ver la Web de dos formas, como en estas imágenes en las que el fondo y la figura se invierten, y lo mismo nos parece un ánfora o una copa que un par de caras enfrentadas vistas de perfil. Al igual que la escritura tiene un significado distinto para el emisario que para el archivero, para Gutenberg que para Platón, la Web tiene dos caras. Por un lado, la Web es un medio de comunicación [21], por otro lado es un repositorio de información y datos, un sistema de memoria exenta.

Cuando ambas figuras se mezclan en una sola, lo que vemos es un sistema inteligente de memoria, una memoria autoorganizada y navegable. La Web que emerge de experiencias de moderación colectiva como Slashdot, buscadores que extraen la información implícita en los enlaces como Google y sistemas de filtrado colaborativo como el mecanismo de recomendaciones de Amazon es una memoria colectiva e inter-relacionada, el hipocampo cibernético de nuestra noosfera.

Notas al pie

[1] Los lectores de Revista de Occidente que también lo sean de Vogue sabrán reconocer en Christie Turlington a la famosa modelo de portada [2] http://news.bbc.co.uk/hi/english/static/avantgo/newsid_677000/677048.htm [3] http://www.taxiknowledge.co.uk/ [4] Sobre Teilhard de Chardin y la relación de sus teorías con las de McLuhan y con la explosión de Internet, puede consultarse el artículo de Jennifer Cobb Kreisler publicado en Wired y titulado "A Globe, Clothing Itself With A Brain": http://www.wired.com/wired/archive/3.06/teilhard.html

[5] http://www.peterme.com/

[6] La definición de Merholz de "¿Qué es un weblog? puede encontrarse en su respuesta a la pregunta de otro insigne weblogger, Derek Powazek: http://www.powazek.com/wtf/post/index.009

[7] Las investigaciones de Pattie Maes están descritas por ella (pero en tercera persona, como si fuera César o un futbolista pillado a traición por un reportero radiofónico) misma en su página web en el MIT: http://pattie.www.media.mit.edu/people/pattie/ Para leer una crítica tan ácida como apenas velada de Pattie Maes y el valor real de sus sistemas de "filtrado colaborativo" por Philip Greenspun, a la sazón estudiante de doctorado en el MIT, échenle un vistazo a este breve comentario, que no tiene desperdicio: https://www.monkey.org/geeks/archive/0002/msg00018.htm

[8] http://www.amazon.com/

[9] http://www.altavista.com/, 20 de octubre de 2000, 01:38 h

[10] The Attention Economy. The Natural Economy of the Net. Michael Goldhaber, First Monday, número 4, segundo año: http://www.firstmonday.dk/issues/issue2_4/goldhaber/

[11] http://slashdot.org/

[12] Sobre la traducción y significado de la palabra "nerd" y su relación con "geek", vease Barrapunto (sitio web en español inspirado por Slashdot): http://barrapunto.com/lengua/100/09/23/0919211 [13] Para entender de verdad Slashdot es imprescindible leerlo y usarlo, contribuir y moderar. Quien no pueda hacerlo y no se conforme con este artículo puede leer un análisis de por qué Slashdot es fiable escrito por Matthew Priestley y publicada en First Monday: http://www.firstmonday.dk/issues/issue4_8/priestley/index.html

[14] http://barrapunto.com/

[15] "Lo mejor de Barrapunto son sus comentarios". Léase el debate suscitado por la pregunta "¿Qué temas son "los de Barrapunto"?, en particular la aportación de José Luis de Vicente, "Trystero": http://www.barrapunto.com/features/100/02/11/1120257

[16] La mejor fuente para entender cómo funciona la moderación de Slashdot es, por supuesto, el propio Slashdot: http://slashdot.org/moderation

[17] Proyecto de tesis que mide la fiabilidad de la moderación de Slashdot: http://slashcode.com/article.pl?sid=00/09/22/1445211

[18] Agradezco a Rafael Lozano-Hemmer que me haya relatado la historia del nacimiento de la cibernética en Ciudad de México. Lozano-Hemmer es un artista Mexicano-Canadiense galardonado con el premio Golden Nica, y cuyo trabajo Alzado Vectorial incluye entre su documentación una breve reseña sobre el nacimiento de la cibernética: http://www.alzado.net/referencia.html

[19] Compartir y repartir: a los efectos de estos párrafos, compartir y repartir no son sinónimos. Compartir implica que todas las personas que comparten disfrutan del todo: se comparte un apellido, la visión de una película en el cine, la experiencia de un viaje inolvidable o el resultado de un desarrollo de software libre. Nótese que todos los ejemplos son inmateriales, están compuestos sólo de información. Repartir implica que las personas que se reparten algo disfrutan sólo de una fracción del todo: se reparte el botín de un robo, se reparten hostias en las peleas de barrio y en las comuniones de las iglesias, se reparten caramelos entre los otros niños cuando se llega por primera vez a una escuela. Nótese que todos los ejemplos son materiales, o bien son objetos físicos o acciones físicas.

[20] http://www.google.com/

[21] Aprovecho cada ocasión que tengo para puntualizarlo: Internet no es un medio, es un canal. Los distintos medios que utilizan internet como canal son la Web, el correo electrónico, el telnet e incluso la televisión y la radio. Expongo este análisis de modo algo más prolijo en mi participación ante el I Congreso Nacional de Periodismo Digital, accesible en: http://www.barrapunto.com/features/100/01/20/1343236

Javier Candeira

El artículo es © de su autor y se publica en sinDominio con el permiso de su autor y de su editor. Última versión, 20 de agosto del 2001