Principal >> Entradas con la etiqueta ‘analisis semantico’

Entradas con la etiqueta ‘analisis semantico’

Análisis semántico y contexto personal

Lunes, Mayo 17th, 2010

Muchas veces me toca hacer de “angel exterminador” de las ilusiones de los clientes en lo tocante al análisis semántico automatizado. En clientes grandes, no es inusual que el reto sea analizar quizás 10.000 informaciones semanales. Ante este panorama, sería sensacional que pudiéramos automatizar completamente el análisis de dicha información, que hubiera un programita que produjera unos resultados equivalentes a que alguien con mucho criterio se hubiera leido esas 10.000 informaciones.

Esto no se puede resolver así de sencillo. Con el paso del tiempo, las empresas que ofrecemos servicios de sentiment analysis hemos aprendido a plantear y resolver estos proyectos de modos mucho más prácticos, pero hoy quería profundizar un poco más sobre otro problema. Y para hacerlo me voy a apoyar en una de las últimas patentes publicadas por Google, en concreto la US 2007/0038601: Aggregating Context data for programmable search engines.

El objetivo de esta patente es proteger una metodología que agrega “contextos”. Contexto en este ámbito es una “intencionalidad de búsqueda”. Una imagen vale más que mil palabras:

contexto

En este caso el mecanismo de agregación de contexto reivindicado no me interesa mucho, pero fijaros en los ejemplos de diferentes contextos para una búsqueda sobre videocámaras:
- usuario profesional
- consumidor
- propietario
- revisiones profesionales
- buscando una videocamara
- comprando una cámara
- soporte técnico
- comparando vendedores
- comparando precios
- …

Observad que hay tantos contextos como personas, y que el contexto de una persona cambia a lo largo del tiempo. Algunos son más prácticos que otros a la hora de ordenar información y seleccionar cúal es más relevante. Como en el análisis del sentimiento el contexto es determinante! No interesan los mismos resultados de búsqueda cuando estás comprando una videocámara que cuando tienes un problema con una; del mismo modo que no valoras igual un comentario sobre el precio de tu producto cuando tu competencia ha bajado el suyo que cuando lo ha subido.

Y esto es muy importante, porque al final te das cuenta que para que una máquina ordene resultados u análice sentimiento igual de bien que un humano… debería tener el mismo contexto que un humano. La historia que le precedió antes de nacer, su vida, su contexto sociocultural, la economía… todo determina el contexto! Desde el pasado día 16, resultados que eran relevantes para la búsqueda en España de “campeón de liga” han dejado de serlo, porque el contexto ha cambiado.

Y esto nos lleva a una última derivada todavía lejana en el tiempo, pero que haría soñar a Carl Sagan o Isaac Asimov. Si necesitamos contextos igual de buenos que los que tienen los seres humanos, que medios tenemos para trasladar el contexto de estos a las máquinas?

——————————–

Este blog publica habitualmente 6 artículos mensuales relacionados con el Social Media, el marketing digital y la recuperación de información en internet. ¿Por que no suscribirte para mantenerte informado de las novedades?
Add to Google

Seguro que conoces a alguien en Facebook o Twitter a quien pueda interesarle este artículo.

Share/Bookmark



Google Squared, una bomba silenciosa

Lunes, Febrero 8th, 2010

Impresionante esta herramienta de Google. Se llama Google Squared y deja entrever hasta que punto ha llegado en el tema del análisis semántico: mucho más lejos que sus competidores, pero mucho menos de lo que la gente sueña.

Aquí os pongo un ejemplo con líderes políticos.
Lo interesante del caso es:
- sabe identificar elementos dentro de un texto que son del mismo tipo
- sabe identificar cuales son los atributos que se pueden extraer de dichos elementos (las columnas)

Es una demostración de fuerza bastante importante que ya habíamos visto por ejemplo en el caso de Swotti, sólo que en este caso el dominio se crea automáticamente (en el caso de Swotti, un humano decide hacer un análisis de móviles, y determina los atributos a analizar, y las frases que se utilizan en dichos atributos; en el caso de Google Squared, esto se hace automáticamente lo que permite analizar microsegmentos sin necesidad de un analista).

Ejemplo de móviles con análisis previo Swotti
Ejemplo al vuelo con Google Squared
Ejemplo de un microsegmento (demostración de que Google no ha puesto analistas para definir los dominios más usuales)