29 oct 2012

GWAP (juegos con un propósito) y web semántica




Con la exorbitante propagación de datos en las redes se hace evidente la necesidad de intentar tratar toda esta información para estructurarla y dotarla de sentido semántico; de allí la Semweb. Si bien la informática ha avanzado a pasos agigantados hay muchos problemas a resolver porque las máquinas no tienen la capacidad perceptiva de las personas, por ejemplo, no pueden reconocer las imágenes. Con la utilización de juegos online para la generación de metadatos semánticos  se podría contribuir a resolver uno de los problemas de la web semántica: la anotación de contenidos web.
 La solución propuesta:  aplicar el concepto de ‘Human Computation’ [1]a un juego online, de manera que los jugadores a base de partidas, solucionen el problema planteado.


  
 Como ejemplo relevante

 GWAP (Games With A Purpose)  

When you play a game at Gwap, you aren't just having fun. You're helping the world become a better place. By playing our games, you're training computers to solve problems for humans all over the world.”


En este paradigma - de Luis von Ahn-  combinando la técnica Human Computation [1]
  y los millones de personas alrededor del mundo dispuestas a invertir tiempo jugando en línea surge lo que se conoce como GWAP (Juegos con un próposito). Los cerebros de las personas hacen el papel de procesadores de un sistema distribuido y cada uno de ellos realiza una pequeña parte de una computación.

No obstante hay una diferencia fundamental con las computadoras y es que las personas necesitan un incentivo para trabajar; por ello estos juegos en línea presentan las siguientes características:
  • Multiusuario
  • Divertidos
  • Juegan dos personas que no se conocen. Las parejas son aleatorias.
  • Si un jugador queda suelto juega con una pareja ficticia simulada por sistema.
  • Se lleva a cabo una tarea. Los jugadores deben ponerse de acuerdo en su resolución.
  • Una partida tiene un tiempo limitado durante el cual se juegan tantos turnos de juego como es posible.
  • Si hay consenso, los jugadores ganan puntos.

 Para ilustrar la idea colaborativa en los GWAP: 
 


En el sitio web gwap.com podemos encontrar varios juegos con propósito: ESP Game, Tag a Tune, Verbosity, Squigl, Matchin, Flipit, PopVideo.


 
ESP Game (ahora ImageLabeler):  Juego en que cada uno de los jugadores se les presenta un a foto y ambos jugadores deben entrar palabras clave (tags) que describan la foto que están viendo.



  




Tag aTune: en este caso la finalidad del juego es la de recolectar etiquetas (tags) musicales de los jugadores.  Deben añadir tags descriptivos para la canción que está escuchando. Luego se les muestran los tags que han escrito cada uno y han de decidir si estaban o no, escuchando la misma canción.


Verbosity: el propósito del juego es recoger sentencias que contengan hechos de sentido común, como por ejemplo “vemos a través de los ojos”. Se asigna el rol de “Descriptor” a uno de los miembros de la pareja al otro el de “adivinador”. Al primero se le da una palabra clave y sobre esta debe construir sentencias con hechos de sentido común. Entonces, esta sentencia se pasa al Adivinador que debe adivinar de qué palabra clave se trata.




Squigl: juego para la recolección de segmentos de imágenes. En dicha aplicación a dos jugadores se le muestra una misma imagen y una palabra relacionada a la imagen y se les pide que tracen una línea contorneando el objeto en la imagen que describe la palabra. En este caso, los usuario obtienen puntos según cuan concordante son los objetos contorneados por ambos jugadores.







Matchin: dos jugadores ven un par de imágenes y se les pregunta cual prefieren. Ellos son premiados con puntos si su voto coincide. Un ranking global de imágenes preferidas puede ser obtenido a partir de la suma de votos.



Flipit: Los jugadores tienen que identificar imágenes  buscando objetos a partir de 16 imágenes que están cubiertas como en el Juego de la Memoria. Para ello se les permite usar la llamada "línea de vida". Una línea de vida revela todas las imágenes durante un corto período de tiempo.






PopVideo: en éste participan varios al mismo tiempo, porque lo que hay que hacer es tener la mayor cantidad de coincidencias con todos los demás. Ponen un video, cada uno lo va describiendo y se ve con cuántas personas a la vez se coincide en el etiquetado.

Gender guesser en éste intentan definir si se es mujer u hombre a partir de la elección de imagen que se  haga. Dos fotos, ¿cuál elegirías?


Otros juegos

Peekaboom (Imagen El jugador “peek” empieza con una pantalla en blanco, mientras que el jugador “boom” visualiza una imagen y una palabra asociada a esta. La finalidad de “boom” es la de revelar partes de la imagen a “peek”, de tal forma que este pueda adivinar la palabra asociada a la imagen.

LabelMe (Imagen)
Al entrar en la herramienta, una imagen de la base de datos serán seleccionada al azar y se deben anotar tantos objetos como sea posible.

Ontogame (Texto y Vídeo) es un proyecto de investigación. Actualmente en su web podemos encontrar varios juegos, entre ellos OntoPronto y OntoTube destinados respectivamente a la anotación de artículos de la Wikipedia y de videos de YouTube.


Una posibilidad mas

Semantic Games (Varios)
SemanticGames.org es un portal de la comunidad que recoge los juegos que tienen como objetivo la creación de contenido semántico sin embargo, estos juegos no son propiedad del consorcio del proyecto ‘Insemtives’. El sitio web debe servir como visión global de los juegos semánticos disponibles en la actualidad en términos de lo que estos juegos se centran en los juegos semánticos dirección de un propósito específico. 

Tales propósitos son, por ejemplo:  la anotación de vídeos, imágenes, textos o sitios web de los archivos de audio,la construcción de la ontología y la ontología de la alineación,la creación de conexiones entre las entradas de blog o interconexión de datos.

Este es un interesante campo, que puede combinar las posibilidades de dos sectores en franca expansión. Los juegos sociales y la Web Semántica. 

Ejemplos de Semantic Games:

The Universe Game mediante la exploración del espacio y el uso de distintos recursos, el participante realizará pequeñas tareas relacionadas con la construcción de una base de datos de anotaciones semánticas. 

TubeLink anotaciones en video. Un audiovisual se muestra al jugador en una bola de cristal rodeado por las etiquetas que podrían ajustarse a él. El jugador tiene que arrastrar las etiquetas correctas a las escenas correspondientes en el video.


Mi valoración personal:

Todo este tema de la Semweb  está avanzando indudablemente, aunque se encuentra “en pañales” aún. Falta mucho para desarrollar y demasiadas dificultades a remontar.
Lograr que los ordenadores sean capaces de recopilar de manera realmente efectiva y veraz la aplastante cantidad de datos que se van multiplicando geométricamente (o con mas vértigo que eso) y, además, pretender que luego nos proporcionen ayuda eficaz en nuestro desempeño en redes es, para alguno, una tarea titánica. 
Me pregunto si no podría suceder que, mientras esto se va desarrollando, se encuentre un camino alternativo para solventar la cuestión y que, oh paradoja, tenga poco que ver con el camino semántico; o, mejor dicho,  sí con la semantización  pues es indispensable, pero no con el modo de llevarla a cabo.

Falibilidad del proceso?
Una anécdota sobre Gender Guesser:   tres hombres pasaron por el juego. A los tres les dió que habia entre un 58 y un 65 % de probabilidades de que fueran mujeres (por las imágenes que habían elegido).
He jugado tres veces y mis resultados en porcentajes de probabilidades son:
    1) 63% de ser una mujer
2) 62% de ser mujer 
                       3) 89% de ser mujer (fui mejorando?)

 
    Evidentemente, hay aciertos pero no tan notorios. Mi deducción es que existen subjetividades que no dependen cabalmente del género, otras que derivan de la experiencia personal y que hacen que podamos elegir ciertas imagenes y no otras, aunque sean supuestamente propias de la elección del otro sexo; además si tomáramos en cuenta la Teoría Queer este juego se hunde por falta de fundamentos válidos. 


Language
Un problema para los hispanoparlantes: todo en inglés.
He jugado en Verbosity  y mis dificultades fueron descorazonantes por esa razón. Mi inglés dista de ser fluído como para encontrar en mi mente definiciones con la rapidez requerida.


Conclusiones provisorias
Parece ser mas indómita de lo que se creía la semantización de datos. 
Las mismas objeciones que se plantean para Gender Guesser son aplicables a cualquier otro parámetro de selección y clasificación de anotaciones; por ende, considero que la percepción semántica desarrollada deja bastante que desear. Según las variables que se tomen en cuenta, como vimos muy suscintamente, serán las tonalidades de los resultados obtenidos.

Sin embargo
-aún con los reparos actuales, me parece ingenioso el utilizar la dedicación y el tiempo de los usuarios de games on line para conseguir aportes manuales en cuanto a las anotaciones semánticas, lo que de otra manera conllevaría mucho mas tiempo y gastos estratosféricos.

-su empleo en el ámbito educativo, aún si las operaciones a realizar en el juego fuesen mas complejas (dada la actitud entusiasta de los jóvenes con todo tipo de juegos lo que hace que lo dominen fácilmente) es muy pertinente; ya que promueve la interacción -aunque sea con compañeros aleatorios-, la autosuperación (no se compite para ganarle a otros sino para superar las pruebas) y el aprendizaje sobre distintos temas, imagenes, etc. por asociación de ideas.

Si desean profundizar  en el tema,  les dejo un trabajo de  revisión del concepto de WebSemántica y de los GWAP como herramienta de migración de los datos en datos semánticos.  Un pequeño estudio de la evolución de la Web, repasando sus orígenes, pasando por el estado actual en la que se encuentra y mostrando cuales son las tendencias de futuro y siguientes fases de evolución, y de las tecnologías que forman parte de esta transformación.

También  información interesante sobre mGWAP, implementación de juegos con un propósito en dispositivos móviles.





[1] Human Computation, contempla el cerebro de cada individuo como un procesador dentro de un sistema distribuido. Invierte los roles: si tradicionalmente una persona usa un ordenador para solucionar un problema, con la computación basada en humanos los roles se invierten y el ordenador pide a una persona o a un grupo de personas que resuelvan el problema; a continuación, la máquina almacena, interpreta e integra las soluciones obtenidas.


20 oct 2012

Web semántica y ontologías.





Conceptos generales:

Técnicamente, la Ontología es la ciencia del ser, la disciplina filosófica más importante que estudia lo que es en tanto que es. Ontología es un término filosófico moderno de origen griego -οντος es el genitivo del participio del verbo ser y λóγος significa ciencia
Ahora bien, el término ontología tiene otro significado en Inteligencia Artificial, donde ha sido tradicionalmente usada como modelo de representación de conocimiento.
Según la definición ofrecida por Gruber (1993) y posteriormente extendida por Studer, Benjamins y Fensel (1998), una Ontología es “una especificación explícita y formal de una conceptualización compartida”;  En otras palabras, al igual que dos personas que hablan de una tercera se entienden porque comparten el mismo concepto, así también dos sistemas inteligentes pueden comunicarse sólo si comparten el mismo conocimiento. Con las ontologías se puede representar este conocimiento para que sea entendible por los ordenadores.
También podemos dar otra definición:  una Ontología estará formada por una taxonomía relacional de conceptos y por un conjunto de axiomas o reglas de inferencia mediante los cuales se podrá inferir nuevo conocimiento.


Lenguaje OWL (web ontology language). 
El desarrollo de la Web semántica requiere la utilización de otros lenguajes como el lenguaje estructurado XML (Extensible Markup Language) y el lenguaje RDF (Resource Description Framework). Otro mecanismo utilizado es el OWL. Lo que hace OWL es proporcionar un lenguaje para definir ontologías estructuradas que pueden ser utilizadas a través de diferentes sistemas. Owl es el lenguaje estándar de la web semántica para expresar y codificar ontologías. Por tanto, puedeser utilizado para representar explícitamente el significado de términos en vocabularios y las relaciones (semánticas) entre ellos.



La ontologización de la web
Aquí dejo un interesante estudio sobre Web semántica y ontologías en el procesamiento de la información documental;el mismo no se cierra a lo bibliotecológico sino que es claramente explicativo de la W3C y, especialmente de las ontologías: sus componentes, técnicas para su generación y cómo se generan,etc. Y a través del cuál comprender, por ejemplo, la diferencia entre taxonomía y ontología semántica; la infraestructura dentro de la cuál el lenguaje ontológico (OWL) operaría, junto con el lenguaje rtf y el xml y las posibilidades de avance en el terreno de la “semantización de la web.


Orientaciones para la reflexión
“Berners-Lee suponía que en la web de un futuro cercano los ordenadores tendrían acceso a  información semánticamente marcada y estructurada, a ontologías que expresarían conceptos, y a conjuntos de reglas de inferencia útiles para llevar a cabo razonamientos automáticos sobre las páginas web que permitiesen a los ordenadores desarrollar tareas inteligentes.”
No es necesario reiterar las ventajas que conllevan este tipo de estructura basada en significados que los ordenadores puedan “leer” para nosotros.
Agrego que con  la incorporación de   herramientas automáticas capaces de comprenderlos,facilite el proceso de recuperación de información y,entre otras cosas, termine con las estrategias fraudulentas de posicionamiento web, las carencias en la puntualización de lo hallado y  la falta de fiabilidad de las fuentes. 
La predicción era su implementación avanzada desde 2001 a siete años vista, lo que no se ha cumplido. Evidentemente, la construcción de la infraestructura de la web semántica presenta dificultades- técnicas y operativas-  que hacen que esto ocurra de modo dilatado.
Entre varias, una de las cuestiones es que  originalmente el método de marcado de la información, html, combina elementos de contenido con otros de presentación (formato).  El tema sería conseguir una web donde el marcado de los documentos se realice de forma “semántica”, es decir, utilizando etiquetas que expresen el significado de los elementos y no su formato (que queda a cargo de normas como xsl o css).
Por otro lado, no existe un modo correcto de elaborar o modelar  un dominio: existen distintas  alternativas que nos proporcionarán diferentes resultados, según cómo trabajemos las clases, las subclases, etc. Esta concepción de las ontologías “como instrumentos adaptados a la resolución de tareas, y por ende, la concepción de las mismas como conceptualizaciones “no” universales de los dominios que representan, lo cual hoy por hoy, choca frontalmente con la concepción universalista de las ontologías del W3C.”
Se espera que se solucione la ausencia de un modelo de datos bien definido en la web, con la  aplicación de las especificaciones del W3C,  junto con el desarrollo y generalización de las ontologías.
Para solventar este y otros problemas se está recurriendo a la ingeniería de ontologías, dedicada al estudio y diseño de aplicaciones que ayuden a su elaboración, mantenimiento y uso. Su principal objetivo es, por tanto, la creación de entornos que, mediante la automatización de ciertas tareas y el diseño del software para su gestión, agilicen el proceso.
La recuperación de datos de origen y su convivencia con las ontologías resultantes; la  imposible reutilización de los complejos ontológicos de manera directa (se necesitan programas para ello), plantean ventajas y desventajas en el uso de ontologías, lo que veremos con un excelente desarrollo teórico en  Objetivo de las ontologías: Web semántica. Además de profundizar en el concepto, terminología básica y pasos para el desarrollo de uan ontología.

Conclusiones provisorias:
Problemáticas de nada fácil resolución traen aparejada incertidumbre sobre el futuro:
 “Muchos dudan de que la transformación de la web actual en la web semántica pueda llegar a ser una realidad algún día”
No obstante,  me parece adecuado  pensar que, sin esperar el lado “utópico” de la web semántica  –y aunque no llegue tal cual se lo imagina- las ontologías sean una tecnología que pueden aportar soluciones ahora a problemas reales actuales.


(1)  Contreras, Jesús, Martínez Comeche. Tutorial Ontologías.  Web semántica y ontologías en el procesamiento de la información documental. Disponible en : http://www.sedic.es/gt_normalizacion_tutorial_ontologias.pdf
(2) Pedraza-Jiménez, Rafael,  Lluís Codina, Cristòfol Rovira OBJETIVO DE LAS ONTOLOGÍAS: LA WEB SEMÁNTICA. El profesional de la información, v.16, n. 6, noviembre-diciembre 2007.  Disponible en: http://www.lluiscodina.com/webSemanticaOntologias2007.pdf
subir

16 oct 2012

Web Semántica. El futuro entre nosotros.




En principio sería necesario definir lo que es Web Semántica.
Seré muy escueta, pero dejaré enlaces donde se puede seguir la pista y profundizar sobre ello.

La Web Semántica vendría a ser la prolongación de la Web actual dotándola de significado; esto es, un espacio donde la información tendría un significado bien definido, de manera que pudiera ser interpretada tanto por agentes humanos como por agentes computarizados.
Comparto un breve vídeo, muy claro, que encontré aquí 

Es importante para muchos teóricos no confundir la web semántica con la web 3.0. 
Según esta distinción, la web 3.0 es mucho más que la web semántica.[1] Es una etapa cronológica (tercera generación) que englobaría  ciertas características, entre ellas la Web Semántica como proceso independiente y en continuo desarrollo, en el que ya estamos inmersos. 
Entonces, se puede inferir que así como la Web Social pertenece a la Era de la Web 2.0 , la Web Semántica lo es de la Era Web 3.0.

Me interesa  reflexionar, partiendo de la realidad instalada de la semantización de la w.w.w. y en basándome, en principio, en el siguiente interrogante:

Es posible la Web Semántica?

La Web de los datos

Alcanzar la plena implantación de la Web Semántica es inmensamente complicado. Implica incorporar al menos una fase de transición: la “Data Web”. Debido a la disparidad de formatos (XML, RDF, microformatos...) el problema a resolver sería hacer que los datos puedan ser accesibles y catalogables mediante lenguajes que son utilizados para el desarrollo de las aplicaciones orientadas a la gestión del conocimiento- como RDF y OWL- para poder seguir avanzando con buen paso.

Obstáculos y resistencias

Sumado a la complejidad en el desarrollo de este modelo, existen barreras
  •  técnicas 
  •  las derivadas de la reticencia o desinterés por parte de los encargados de adaptar sus espacios a esta nueva realidad. 
Hay que tener en cuenta que esta ingente labor debe ser realizada a mano y requiere de fuertes conocimientos técnicos (de una tecnología que no está totalmente estandarizada y en constante fase beta).

Otras dificultades:
  •  muchos sitios tienen una visión más privativa de sus datos, y lógicamente no están dispuestos a compartir tal información. 
Es comprensible que si ya luchan contra el Web scrapping o robo de contenidos, no deseen “hacer fácil” esta  práctica. 

  • los modelos orientados a publicidad, ven también con cierto recelo este nuevo concepto, al creer que hace peligrar su enfoque de negocio. 
Muy al contrario, la publicidad semántica mejoraría notablemente su contexto, abordando de forma más precisa los intereses y target objetivos, dejando de ser considerada como spam y transmitiendo una mejor imagen de cara al público en general que la invasiva publicidad actual).

Sin embargo, sería factible mencionar grandes compañías que optaron por apostar a un futuro promisorio. En lugar de enumerarlas dejo datos al respecto:

Quiénes apuestan a favor? 
Hoy:
Consorcios  comerciales
Motores de búsqueda científicos
Motores de búsqueda administrativos
Agencias de publicidad

En el futuro:
  • Todos los anteriores
Motores de búsqueda de uso público
Corporativos con visión estratégica de crecimiento.


Esto siguiente es sobre una jornada -"La Web Inteligente, experiencias de hoy de la internet del futuro"- organizada por la CEIN e iSOCO.

 Y esto otro (tanto enlace como presentación) amplía sobre la Web Semántica en las empresas y ofrece ejemplos de aplicaciones reales de la semweb



Por qué se utilizan estas estrategias?

Es importante definir en qué beneficia utilizar estas nuevas capacidades táctico-semánticas.Lo resumo (aunque no es excluyente de otros enfoques, ampliaciones o desarrollos) en:

Mayor cantidad de adeptos, clientes, seguidores
Posibilidad de incremento en las ganancias de cada empresa.
A nivel científico citas y referencias gradualmente mas frecuentes en investigación de vanguardia 
El plus gratuito que internet y sus multiples recursos otorgan a sus usuarios.
 “Inmediatez, personalización, mecenazgo, interpretación, autenticidad, accesibilidad, etc. (ver  Kevin Kelly. Mejor que gratis


Es imposible ponerle vallas al campo. Y nada recomendable.
Puntualizo en que lo social en evolución hacia un mayor bienestar y en sentido expandido, debería ser el eje de toda innovación o "revolución", en este caso en las redes; el desarrollo económico siempre lo he visto como una manera de mejorar todas las instancias de lo humano en sociedad, aunque parezca una hippie de los ´60.

Cierro sin clausurar caminos , para continuar reflexionando, con dos frases de Dolors Reig: 

  • Web  semántica es
                            “Un entorno en el que sea el lenguaje de las computadoras el que entienda el humano, y no al revés” 

  • "la apertura ya resulta una deuda social exigible en favor de la transparencia, operabilidad y eficiencia en la web"



[1] La web semántica fue imaginada, de hecho, por el propio Tim Berners mucho antes de la tercera década de la web.En cambio, en la Web 3.0, como expresa Dolors Reig:
 " . . .  se incluyen muchos otros conceptos, que el tiempo dirá si son tanto o más importantes que el de la propia semantización de los datos que vamos depositando, directa o indirectamente". La web 3.0 incluye, por ejemplo,  la web al cuadrado, la squared web, que supone el añadido de los datos del mundo real transmitidos a partir de sensores a la web.