Principal >> Archivo para mayo, 2010

Archivo para mayo, 2010

Previsiones IDC mercado búsqueda y descubrimiento de información

Lunes, mayo 31st, 2010

El pasado abril IDC actualizó sus previsiones para el mercado de búsqueda y recuperación de información a nivel mundial.

El último documento que tengo databa del 2009 y contenía previsiones hasta el 2012. En el se decía que el mercado pasaría de los 1.806 millones de dólares del 2007 a 3.183$ en el 2012, y situaba un umbral de información total de 988 Exabytes (unos mil millones de gigabytes) para el 2010.

No encuentro el acceso a este nuevo documento pero seguro que será muy interesante. Como dijimos hace algún tiempo, el campo de la recuperación de la información tiene un potencial tremendo y a día de hoy no se le ve techo, puesto que gran parte de la información que puede ser producida por un ser humano cada segundo todavía no hay manera de subirla a internet (podemos subir lo que escribe, lo que ve, lo que oye, pero no lo que toca, lo que siente, lo que piensa, lo que huele…), y el número de usuarios concurrentes a internet todavía no es muy grande (quizás 500 millones en un momento dado de los 6.000 millones que tiene la tierra). ¿cual sería esa cifra si todos los seres humanos estuvieran conectados a internet concurrentemente, almacenando en ella toda la información que fueran capaces de producir? Este es un escenario para soñar, parecido al que veíamos en la película Matrix.

A esta cifra habría que sumar la información producida por los dispositivos no humanos. Por ejemplo en el informe IDC del 2008 se comentaba que una parte importante del incremento de tráfico venía de las cámaras – ip. También las redes P2P y el vídeo (Youtube principalmente) incrementan muy significativamente el caudal necesario.

Realmente el crecimiento de la información disponible en internet seguira creciendo espectacularmente, con especial atención a los dispositivos m2m e interfaces avanzados hombre – máquina. Por el lado de las barreras la principal es la capacidad de almacenamiento y computación que actualmente no es capaz de seguir el ritmo de tanta “nueva información” (hay demanda de mayor almacenamiento; no almacenamos todo lo que podríamos porque no hay recursos disponibles). En este lado de la balanza hay que seguir de cerca la computación cuantica y las nuevas tecnologías de almacenamiento.

————————————

Este blog publica habitualmente 6 artículos mensuales relacionados con el Social Media, el marketing digital y la recuperación de información en internet. ¿Por que no suscribirte para mantenerte informado de las novedades?
Add to Google

Seguro que conoces a alguien en Facebook o Twitter a quien pueda interesarle este artículo.

Share/Bookmark



Análisis semántico y contexto personal

Lunes, mayo 17th, 2010

Muchas veces me toca hacer de “angel exterminador” de las ilusiones de los clientes en lo tocante al análisis semántico automatizado. En clientes grandes, no es inusual que el reto sea analizar quizás 10.000 informaciones semanales. Ante este panorama, sería sensacional que pudiéramos automatizar completamente el análisis de dicha información, que hubiera un programita que produjera unos resultados equivalentes a que alguien con mucho criterio se hubiera leido esas 10.000 informaciones.

Esto no se puede resolver así de sencillo. Con el paso del tiempo, las empresas que ofrecemos servicios de sentiment analysis hemos aprendido a plantear y resolver estos proyectos de modos mucho más prácticos, pero hoy quería profundizar un poco más sobre otro problema. Y para hacerlo me voy a apoyar en una de las últimas patentes publicadas por Google, en concreto la US 2007/0038601: Aggregating Context data for programmable search engines.

El objetivo de esta patente es proteger una metodología que agrega “contextos”. Contexto en este ámbito es una “intencionalidad de búsqueda”. Una imagen vale más que mil palabras:

contexto

En este caso el mecanismo de agregación de contexto reivindicado no me interesa mucho, pero fijaros en los ejemplos de diferentes contextos para una búsqueda sobre videocámaras:
- usuario profesional
- consumidor
- propietario
- revisiones profesionales
- buscando una videocamara
- comprando una cámara
- soporte técnico
- comparando vendedores
- comparando precios
- …

Observad que hay tantos contextos como personas, y que el contexto de una persona cambia a lo largo del tiempo. Algunos son más prácticos que otros a la hora de ordenar información y seleccionar cúal es más relevante. Como en el análisis del sentimiento el contexto es determinante! No interesan los mismos resultados de búsqueda cuando estás comprando una videocámara que cuando tienes un problema con una; del mismo modo que no valoras igual un comentario sobre el precio de tu producto cuando tu competencia ha bajado el suyo que cuando lo ha subido.

Y esto es muy importante, porque al final te das cuenta que para que una máquina ordene resultados u análice sentimiento igual de bien que un humano… debería tener el mismo contexto que un humano. La historia que le precedió antes de nacer, su vida, su contexto sociocultural, la economía… todo determina el contexto! Desde el pasado día 16, resultados que eran relevantes para la búsqueda en España de “campeón de liga” han dejado de serlo, porque el contexto ha cambiado.

Y esto nos lleva a una última derivada todavía lejana en el tiempo, pero que haría soñar a Carl Sagan o Isaac Asimov. Si necesitamos contextos igual de buenos que los que tienen los seres humanos, que medios tenemos para trasladar el contexto de estos a las máquinas?

——————————–

Este blog publica habitualmente 6 artículos mensuales relacionados con el Social Media, el marketing digital y la recuperación de información en internet. ¿Por que no suscribirte para mantenerte informado de las novedades?
Add to Google

Seguro que conoces a alguien en Facebook o Twitter a quien pueda interesarle este artículo.

Share/Bookmark