Principal >> Archivo para la categoría ‘Sin categoría’

Archivo para la categoría ‘Sin categoría’

Sobre COSI (cloud oriented subgraph identification)

Miércoles, junio 30th, 2010

Rodolfo Carpintier comentaba en su post Google cree que tiene que detener a Facebook sobre las posibilidades de un algoritmo de búsqueda optimizado para redes sociales.

En los comentarios de su blog le contesto con un nuevo algoritmo llamado COSI (paper here) salido de la Universidad de Maryland, que puede provocar movimientos accionariales de primera magnitud en la escena de los buscadores y las redes sociales.

Medios de comunicación y buscadores

Lunes, junio 28th, 2010

Enrique Dans comenta en su post Entendiendo al usuario una interesante reflexión acerca de la convergencia de buscadores y medios de comunicación. Los buscadores se editorializan y los diarios tienen que disponer de tecnología de buscador y equipos expertos en recuperación de la información para poder competir. Esto es algo que ya comentamos hace algún tiempo en Prensa escrita, problemas y soluciones:

A nivel tecnológico, los medios digitales tienen que subirse al carro de internet definitivamente. No es comprensible que los medios digitales no cuenten todavía con tecnología de rastreo de la información que se está produciendo en internet, que no monitoricen lo que se dice de los partidos, de las empresas, de las personas, en los medios sociales, en los foros, en los comparadores de opinión, en la blogosfera… Para cubrir ese campo tan amplio se necesita tecnología para orquestar esos volúmenes de información. ¿Qué medios de comunicación tienen hoy en día tecnología de rastreo?

Creo que la llegada del ipad y dispositivos similares no les deja ver el movimiento de fondo. La llegada del iPad les mantiene en su sueño de que podrán mantener como unidad de contenido y compra la edición diaria, cuando estamos en un mundo que gracias a la tecnología compra noticias y comentarios sueltos, y accede a ellos a través de tecnología de recuperación de la información.

googlevsbing

—————————–

Este blog publica habitualmente 6 artículos mensuales relacionados con el Social Media, el marketing digital y la recuperación de información en internet. ¿Por que no suscribirte para mantenerte informado de las novedades?
Add to Google

Seguro que conoces a alguien en Facebook o Twitter a quien pueda interesarle este artículo.

Share/Bookmark



Necesitamos expertos en la ciencia de los datos

Martes, junio 8th, 2010

En What is data science? Mike Loukides hace un delicisioso análisis de una de las principales tendencias en internet: la explotación de datos. Y en concreto, afirma que “el futuro pertenece a aquellas empresas y personas que convierten los datos en productos”.

Posteriormente, reflexiona sobre cúales serían las cualidades que tendría que poseer esa persona y dice “la ciencia de los datos requiere habilidades que van desde la ciencia de los computadores, las matemáticas y el arte”. Sensacional! Cuantas veces hemos pensado como programadores que nuestro trabajo estaba más cerca del arte que de la ingeniería. También concluye “que tipo de persona buscas para contratar un científico de datos? probablemente el mismo tipo de persona con la que fundarías una empresa“.

El artículo es muy recomendable porque hace un repaso a las tecnologías que van a conducir una nueva era de aplicaciones en internet, en concreto:

data science
data conditioning
natural language processing
XML parsers
machine learning libraries
NoSQL databases, or Non-Relational databases
Cassandra
Apache Hadoop
MapReduce
Amazon’s Elastic MapReduce
HDFS (distributed filesystem)
Hive
high-level dataflow language: Pig
Hadoop Online Prototype (HOP)
artificial intelligence
Mahout
OpenCV
data Visualization

Recomiendo el artículo sin dudarlo.

———————————–

Este blog publica habitualmente 6 artículos mensuales relacionados con el Social Media, el marketing digital y la recuperación de información en internet. ¿Por que no suscribirte para mantenerte informado de las novedades?
Add to Google

Seguro que conoces a alguien en Facebook o Twitter a quien pueda interesarle este artículo.

Share/Bookmark



Previsiones IDC mercado búsqueda y descubrimiento de información

Lunes, mayo 31st, 2010

El pasado abril IDC actualizó sus previsiones para el mercado de búsqueda y recuperación de información a nivel mundial.

El último documento que tengo databa del 2009 y contenía previsiones hasta el 2012. En el se decía que el mercado pasaría de los 1.806 millones de dólares del 2007 a 3.183$ en el 2012, y situaba un umbral de información total de 988 Exabytes (unos mil millones de gigabytes) para el 2010.

No encuentro el acceso a este nuevo documento pero seguro que será muy interesante. Como dijimos hace algún tiempo, el campo de la recuperación de la información tiene un potencial tremendo y a día de hoy no se le ve techo, puesto que gran parte de la información que puede ser producida por un ser humano cada segundo todavía no hay manera de subirla a internet (podemos subir lo que escribe, lo que ve, lo que oye, pero no lo que toca, lo que siente, lo que piensa, lo que huele…), y el número de usuarios concurrentes a internet todavía no es muy grande (quizás 500 millones en un momento dado de los 6.000 millones que tiene la tierra). ¿cual sería esa cifra si todos los seres humanos estuvieran conectados a internet concurrentemente, almacenando en ella toda la información que fueran capaces de producir? Este es un escenario para soñar, parecido al que veíamos en la película Matrix.

A esta cifra habría que sumar la información producida por los dispositivos no humanos. Por ejemplo en el informe IDC del 2008 se comentaba que una parte importante del incremento de tráfico venía de las cámaras – ip. También las redes P2P y el vídeo (Youtube principalmente) incrementan muy significativamente el caudal necesario.

Realmente el crecimiento de la información disponible en internet seguira creciendo espectacularmente, con especial atención a los dispositivos m2m e interfaces avanzados hombre – máquina. Por el lado de las barreras la principal es la capacidad de almacenamiento y computación que actualmente no es capaz de seguir el ritmo de tanta “nueva información” (hay demanda de mayor almacenamiento; no almacenamos todo lo que podríamos porque no hay recursos disponibles). En este lado de la balanza hay que seguir de cerca la computación cuantica y las nuevas tecnologías de almacenamiento.

————————————

Este blog publica habitualmente 6 artículos mensuales relacionados con el Social Media, el marketing digital y la recuperación de información en internet. ¿Por que no suscribirte para mantenerte informado de las novedades?
Add to Google

Seguro que conoces a alguien en Facebook o Twitter a quien pueda interesarle este artículo.

Share/Bookmark



Análisis semántico y contexto personal

Lunes, mayo 17th, 2010

Muchas veces me toca hacer de “angel exterminador” de las ilusiones de los clientes en lo tocante al análisis semántico automatizado. En clientes grandes, no es inusual que el reto sea analizar quizás 10.000 informaciones semanales. Ante este panorama, sería sensacional que pudiéramos automatizar completamente el análisis de dicha información, que hubiera un programita que produjera unos resultados equivalentes a que alguien con mucho criterio se hubiera leido esas 10.000 informaciones.

Esto no se puede resolver así de sencillo. Con el paso del tiempo, las empresas que ofrecemos servicios de sentiment analysis hemos aprendido a plantear y resolver estos proyectos de modos mucho más prácticos, pero hoy quería profundizar un poco más sobre otro problema. Y para hacerlo me voy a apoyar en una de las últimas patentes publicadas por Google, en concreto la US 2007/0038601: Aggregating Context data for programmable search engines.

El objetivo de esta patente es proteger una metodología que agrega “contextos”. Contexto en este ámbito es una “intencionalidad de búsqueda”. Una imagen vale más que mil palabras:

contexto

En este caso el mecanismo de agregación de contexto reivindicado no me interesa mucho, pero fijaros en los ejemplos de diferentes contextos para una búsqueda sobre videocámaras:
- usuario profesional
- consumidor
- propietario
- revisiones profesionales
- buscando una videocamara
- comprando una cámara
- soporte técnico
- comparando vendedores
- comparando precios
- …

Observad que hay tantos contextos como personas, y que el contexto de una persona cambia a lo largo del tiempo. Algunos son más prácticos que otros a la hora de ordenar información y seleccionar cúal es más relevante. Como en el análisis del sentimiento el contexto es determinante! No interesan los mismos resultados de búsqueda cuando estás comprando una videocámara que cuando tienes un problema con una; del mismo modo que no valoras igual un comentario sobre el precio de tu producto cuando tu competencia ha bajado el suyo que cuando lo ha subido.

Y esto es muy importante, porque al final te das cuenta que para que una máquina ordene resultados u análice sentimiento igual de bien que un humano… debería tener el mismo contexto que un humano. La historia que le precedió antes de nacer, su vida, su contexto sociocultural, la economía… todo determina el contexto! Desde el pasado día 16, resultados que eran relevantes para la búsqueda en España de “campeón de liga” han dejado de serlo, porque el contexto ha cambiado.

Y esto nos lleva a una última derivada todavía lejana en el tiempo, pero que haría soñar a Carl Sagan o Isaac Asimov. Si necesitamos contextos igual de buenos que los que tienen los seres humanos, que medios tenemos para trasladar el contexto de estos a las máquinas?

——————————–

Este blog publica habitualmente 6 artículos mensuales relacionados con el Social Media, el marketing digital y la recuperación de información en internet. ¿Por que no suscribirte para mantenerte informado de las novedades?
Add to Google

Seguro que conoces a alguien en Facebook o Twitter a quien pueda interesarle este artículo.

Share/Bookmark



Cierzo development invitada a mostrar su tecnología SMMART FOR PARTNERS en la prestigiosa Apache Lucene Eurocon 2010

Martes, abril 27th, 2010

La empresa Cierzo Development participará como ponente dentro del selecto grupo de empresas europeas que han sido invitadas a la conferencia Apache Lucene Eurocon 2010, que se celebrará en Praga del 18 al 21 de Mayo.

En esta conferencia, Cierzo Development mostrará su nuevo producto “SMMART For Partners”, una potente tecnología destinada a integradoras o grandes empresas que desean construir sistemas de vigilancia en internet sin tener que depender del rastreo de la información. Esta solución ofrece una solución tipo “tarifa plana anual” a sus partners, que pueden consumir su índice sobre el internet español compuesto por más de 6 millones de fuentes actualizadas en tiempo real, con miles de millones de informaciones almacenadas y una memoria de un año, para construir sus propias soluciones a medida.

El elegante uso que hace esta solución del estado del arte de tecnologías “open source” ha llamado la atención del destacado comité organizador del evento Apache Lucene Eurocon 2010, entre los que se encuentran los fundadores de empresas que lideran el movimiento “open source” de rastreo de información a nivel mundial como Grant Ingersoll (Creador de Apache Mahout y Commiter de Apache Solr) ó Simon Willnauer (Consultor de Apache Solr, Lucene Java and Hadoop y co-organizador del “BerlinBuzzwords”).

La invitación cursada a Cierzo Development para participar en este evento la sitúa en un reducido grupo de 20 empresas europeas con desarrollos llamativos sobre estas tecnologías, sólo acompañados en España por Marc Sturlese (Desarrollador del portal Trovit) y la Fundación Barcelona Media, perteneciente a la Universidad Pompeu Fabra.

Sobre SMMART for Partners. Esta tecnología, construida sobre el estado del arte de tecnologías de computación, almacenamiento, rastreo, indexación y recuperación de información, permite a Cierzo Development ofrecer a terceros su tecnología de rastreo para implementar sus propias soluciones a medida, sobre el consumo del API de SMMART for Partners. Esta API puede ser utilizada tanto para soluciones de internet, como para rastreo de intranets, en lo que se ha venido a llamar la Enterprise Social Search. También permite ser usado sobre subconjuntos de información disponible como un determinado país, lenguaje, etc.

Dentro de una fase beta ya son varios los partners que se han adherido al programa y construido sus soluciones a medida sobre esta potente base, y debido al consumo generado se está actualmente escalando el servicio. Esto permite a los integradores dejar atrás un modelo anticuado y peligroso: basar sus servicios en herramientas gratuitas de terceros como Google o Yahoo, que no autorizan su uso para explotación comercial, y en cambio profesionalizar mediante Smmart For Partners sus soluciones de reputación online.

Sobre Cierzo Development. Cierzo Development es una startup radicada en el CEEI Aragón, con un fuerte foco en el campo de recuperación de información en internet, concentrada en su suite de soluciones Smmart. Cierzo Development recibió el premio a Mejor Empresa Emprendedora de Aragón Aster – ESIC 2009, y un porcentaje importante de las empresas del Mercado Continuo utilizan sus servicios de vigilancia de reputación online.

———————————-

Este blog publica habitualmente 6 artículos mensuales relacionados con el Social Media, el marketing digital y la recuperación de información en internet. ¿Por que no suscribirte para mantenerte informado de las novedades?
Add to Google

Seguro que conoces a alguien en Facebook o Twitter a quien pueda interesarle este artículo.

Share/Bookmark



Proyecto GAMO: Una nueva manera de hacer marketing para los sectores tradicionales

Miércoles, marzo 31st, 2010

Una nueva sorpresa se prepara en las cocinas de Cierzo Development: se trata del proyecto GAMO, el desarrollo de un sistema que permitirá el desarrollo del marketing online a los sectores más tradicionales.

Este proyecto, pretende revolucionar la manera en la que hacen su comunicación y su marketing las empresas pertenecientes a sectores más tradicionales. Es un modo de acercar internet nos sólo a las empresas más grandes y modernas, sino también a las pymes y a aquellos sectores que tienen más dificultades con el uso de las nuevas tecnologías.

Este proyecto está liderado por Cierzo Development y Taller Digital, y apoyado por el Ministerio de Industria, Turismo y Comercio a através del subprograma Avanza I+D que se enmarca dentro del Plan Nacional de Investigación Científica, Desarrollo e Innovación tecnológica 2008-2011.

En breve, lanzaremos las primeras versiones del GAMO en modo beta. Queremos que el GAMO sea la puerta de entrada a una nueva manera de hacer marketing.

¿te gusta lo que los bloggers dicen de tu marca? Mejor…

Jueves, marzo 25th, 2010

Excelente vídeo sobre la social media revolution. Me ha hecho pensar que estamos trabajando en algo que no existía cuando comenzamos a estudiar. En mi caso ni siquiera existía cuando iba al instituto. Lo más parecido era Fidonet. ¿que tipo de trabajo que ahora desconocemos tendrán nuestros hijos?

Algunos datos que deja el vídeo:
25% de los resultados de búsqueda de las 20 marcas líderes del mundo son contenido
generado por el usuario. el 34% de los bloggers emite opiniones sobre marcas y productos

No me creo ni de coña que Enrique Dans tenga 95.000 followers (1/5)

Miércoles, marzo 24th, 2010

Venga ya hombre! ¿Nos estamos volviendo todos locos o qué? Vaya por delante que Twitter es una herramienta útil, un buen punto de apoyo que sustituye algunas pequeñas funcionalidades de las que carece el correo electrónico, pero últimamente estoy oyendo cosas que me hacen alucinar en colores.

Vaya por delante también que soy tan friki como tú. No se me puede acusar de resistente a las nuevas tecnologías o late-adopter. Cuando mis amigos daban patadas a un balón como máxima aspiración yo me dedicaba a conseguir módems de 300 baudios de un amigo escocés  para poder conectarme a la mítica Public Enemy, la primera BBS que hubo en Zaragoza. Si no sabes lo que es una BBS imagínate como de friki soy.

Volvamos a twitter, donde las agencias están vendiendo campañas como si twitter fuera la respuesta o la alternativa a los medios de comunicación tradicionales. Pero señores, un poco de sentido común! ¿Dónde están las métricas que me demuestran el grado de cobertura o el roi que tienen esas acciones? No se ven por ningún lado.

Seamos sinceros, fuera del ámbito tecnológico y político (que parecen ser los más extendidos segmentos) twitter es poca cosa. Quizás el tercer segmento, a una gran distancia, el de las propias agencias, el marketing, la comunicación, que cierran el círculo sobre ellas mismas.

Y así llegamos a Enrique Dans, con sus 95.000 followers. Y lo escojo porque es uno de los que más tienen en España, y supera un umbral señalado en varios estudios científicos que separa los nodos de una red potentes de los “extraordinariamente potentes” (ver por ejemplo el excelente estudio “Measuring user influence in twitter: The million follower fallacy”). He estado haciendo cálculos de las probabilidades de que uno de sus 95.000 followers lea en un momento dado uno de sus twitts. Los resultados son sorprendentes incluso extendiendo el estudio a varios grados (los que leen a los que le leen, los que leen a los que leen a los que le leen), los postearé en una siguiente entrega, pero ya les anticipo que sitúa el nivel de influencia de estos 95.000 followers entre bajar al bar y contar nuestras penas uno por uno a todos los clientes, o acercarse a la Romareda y en el descanso del Zaragoza-Barcelona aprovechar para gritar “muerte a la ley sinde” antes de que suene el himno y vuelva a salir Messi a destrozarnos. Imagínese el resto de los mortales que contamos con 100, 1.000, 2.000 followers…

No, la influencia de Enrique no proviene de su número de followers, eso es más bien la consecuencia de su influencia. Su influencia proviene de estar bien informado, producir contenidos de calidad a un ritmo elevado (a veces varios contenidos al día!), y ser un buen comunicador. Los followers son el resultado de su posición en el mundo, que difícilmente la hubiera logrado centrándose en incrementar su número de followers en vez de en trabajar de verdad.
¿Les parece exagerado? En nuestros rastreos del twitter español no salen ni 5.000 usuarios que por su interactividad merezcan la pena. ¿Necesitan una prueba? Por poner unos datos que compartamos ustedes y yo, según el ranking de twitter de Alianzo en La Rioja no hay ni 10 usuarios dignos de mención (y vean sus estadísticas, no están todo el día colgados de twitter que digamos).Tomemos estos datos con cautela, el índice Alianzo puede estar bastante desactualizado, pero ahí queda esa foto de la realidad cuando Enrique Dans tenía 94.662 followers. O sea, que en una región con 300.000 habitantes tenemos 10 usuarios… mmm … vamos a ver…. Rediseñemos el plan de marketing teniendo en cuenta que en Logroño, de 150.000 habitantes, hay unos 25  bares y restaurantes buenos buenos buenos, de los que tienen pinchos que habría que probar al menos una vez en la vida, y yo les invito a hacer una jornada de tapeo y vamos hablando de las bondades de nuestro producto con la gente que nos encontremos, ya así batimos por unos 300€ a cualquier agencia que se proponga usar twitter en Logroño.  Cuando se nos acabe Logroño seguimos con Tudela, Tarazona, Borja, y yo les dejo repletos de followers REALES en la estación del AVE de Zaragoza, de vuelta a su capital.

Antes de acabar vuelvan de nuevo al ranking Alianzo para Aragón, comunidad eminentemente industrial y logística, cuya capital cuenta con casi un millón de habitantes y está interconectada con AVE con Madrid y Barcelona en 1 hora y 20 minutos. Así descartamos diferentes grados de penetración de Twitter por tamaño de ciudad y de desarrollo tecnológico. Vean ustedes los usuarios que figuran para Aragón en las posiciones finales del top 50 y respondan: ¿Qué será más efectivo, hacer una campaña para Zaragoza en Twitter o que repartamos 50 flyers a la entrada de un cine? Asumamos que el índice está desactualizado, yo me comprometo a repartir más flyers por el resto de cines de la ciudad.

Pero puedo estar equivocado, y de hecho desearía estarlo. Desde aquí les  pido ayuda, envíenme  métricas de sectores que demuestren que se han conseguido impactos significativos en España con Twitter, prometo publicarlas todas.

Actualización 25/3/2010
Laura nos envía un par de ejemplos muy buenos del impacto que se puede conseguir en Twitter, y además nos demuestra como puede ser utilizada bit.ly como excelente herramienta para medir la conversión en Twitter (gracias Laura! :)

http://bit.ly/info/7ZbcwP

http://bit.ly/info/a8A81A

(Continuara…)

La sociedad abierta y sus enemigos

Martes, marzo 23rd, 2010

Son las 10:06 y mi AVE destino a Madrid para en Guadalajara. Hace escasos minutos Zapatero ha finalizado su intervención en el congreso y Rajoy está en estos mismos momentos reivindicando que España es una nación. Lo sé porque una legión de usuarios está escribiendo en Twitter cada una de las frases que se dicen en el congreso. Justo ahora se abre el pdf con el discurso íntegro de Zapatero que he podido descargar de la web de un periódico.

Reflexiono sobre si somos o no una gran nación. Yo creo que sí. Las infraestructuras que hacen posible que una startup zaragozana tenga el 95% de su facturación fuera de Aragón así lo demuestran. Que pueda trabajar conectado a internet en el AVE refleja un país con potencial de desarrollo. Que pueda descargar un discurso del presidente escasos segundos después de haber finalizado su locución habla de un nivel alto de trasparencia de la sociedad civil. Que todos los que tienen algo que decir estén enchufados al “poderoso stream” de twitter habla mucho de la cultura tecnológica de la clase empresarial.

Me viene a la mente Popper y comienzo a reflexionar sobre los enemigos de nuestra sociedad abierta, porque parece que desde el año 89 la filosofía social y económica estaba huérfana de enemigos. Pienso en el crecimiento imparable de la masa monetaria, como fuente última e insolucionable del saqueo de los recursos materiales de la tierra, creadora de burbujas, construidora de valor 0.

Me acerco a Europa y contemplo anonadado la consolidación de una Europa asimétrica pero que renuncia a marchas forzadas al concepto de solidaridad, una bomba de extracción de riqueza desde el norte hacia el sur.

Cuando llego a España, encuentro a esos enemigos de la sociedad abierta en las tribus que se dedican a construir trincheras ideológicas, linguisticas, culturales y morales, no por el beneficio del conjunto, sino por el beneficio de su tribu.

Y cuando llego al plano tecnológico, que es el mío (a que me meto en otros jardines!) observo preocupado la falta de interoperatividad de las telecos que siguen bloqueando el desarrollo de la telefonía ip (y ahora de los buscadores), los monopolios de facto en muchas industrias tecnológicas, y los que quieren poder censurar sin un juez la libre expresión.

Esos son los enemigos de la sociedad abierta.

Políticos: cuidadito con Youtube. Nigel Farage la monta de nuevo

Miércoles, marzo 3rd, 2010

Hay un vídeo que ha conseguido en Youtube casi 1 millón de visualizaciones en la última semana. Se trata de la “arenga” que le dedica Nigel Farage a Herman Van Rompuy en el Parlamento Europeo.

hermanvanrompuy2

nigel-farage

Para los que todavía no lo saben (y casi nadie lo sabe) Herman Van Rompuy es el presidente de la Unión Europea. ¿se imaginan que el Presidente del Reino de España fuera elegido por una élite de tecnócratas en vez de por sufragio universal? Eso era precisamente lo que le reprochaba Nigel Farage cuando le decía “quien eres tu??,como puede el pueblo removerte de donde estás??”. Por otro lado Nigel Farage es un maleducado crónico, pero dice verdades como puños. Ya las había dicho antes sobre la fallida Constitución Europea y su resurrección por la puerta de atrás en un ente llamado Tratado de Lisboa. Nigel no tiene sentido de la educación y carece completamente de humildad, pero el decir las verdades más evidentes, el gran elefante en la habitación, lo hace un candidato excelente a la propagación vírica, sobre todo cuando le dice a un Presidente no electo lindezas como “tiene usted el carisma de un trapo mojado y la apariencia de un banquero de tercer nivel”.

Viendo este vídeo recordaba los mejores momentos de Ron Paul dirigiéndose al Congreso de Estados Unidos aportándo una isla de cordura sobre tmas vitales como la guerra de Irak, el papel de la FED, o la expansión monetaria. Aplica lo mismo: político sin ambición de gobierno real que puede permitirse decir verdades como puños, que son reconocidas rápidamente por los ciudadanos que las reproducen víricamente. Hay algún caso femenino de este tipo en la política española.

Por supuesto, el vídeo (más bien un conjunto de una docena de ellos en varios lenguajes) está batiendo todos los records de audiencia y alcanzando un conjunto increible de lo que Google llama “galardones”: vídeo más visto, comentado y favorito de la semana y del mes en prácticamente todos los paises de la OCDE.

Lo más preocupante del caso es analizar donde se está consumiendo el vídeo:

stats

Esto es una llamada de atención como un piano de grande. Ojo políticos de Europa: la imagen que estamos dando ante el mundo es bochornosa. Cuando vemos que el vídeo está siendo consumido intensivamente en Estados Unidos o en Australia, nos preguntamos por qué. Cuales son los mecanismos por los que este vídeo tiene tanta demanda en dichos paises. ¿que estarán pensado de la Unión Europea en dichos paises? Cuando se analiza la trayectoria del vídeo, que también se puede, se observa que el salta de continente a través de los medios británicos, pero el consumo que tiene fuera de Europa es anómalamente grande.

Si alguien está preocupado por la densidad de cobertura del vídeo en España, comentar que hay otras versiones del mismo en castellano.

La reflexión relacionada con la política y el social media es… Cuidado con las redes sociales. Ya no podremos encerrar bajo cuatro llaves las verdades como puños, porque la sociedad utilizará a sus elementos más extremos para desbaratarlos, y tiene elementos para restituir su derecho a la representatividad popular y al sufragio, allí precisamente donde se le niega.

ISAAC ASIMOV Y GOOGLE CONTRA KARL R. POPPER

Martes, febrero 23rd, 2010

¿Pero que tienen que ver un escritor de ciencia ficción, un monstruo tecnológico y un sociólogo?

Afortunadamente mucho, por lo menos para Cierzo Development. En las rendijas del sistema, en los solapes entre lo que antes eran compartimentos estancos, se producen cosas sorprendentes que hace que nuestro trabajo merezca la pena, y que tengamos la sensación de que estamos haciendo historia. Intentaremos explicarlo de menos a más complicado.

Isaac Asimov nos dio una serie de relatos de ciencia ficción preciosos llamados “La fundación”. Tratan sobre un sociólogo llamado “Hari Seldon… fue el quien perfeccionó la psicohistoria, la ciencia del comportamiento humano reducido a ecuaciones matemáticas… Seldon descubrió que las reacciones de la masa humana podían ser tratadas estadísticamente”. Seldom consigue determinar con sus ecuaciones cuando se producirá el fin del imperio galáctico, y crea dos fundaciones (una visible dedicada a la física y otra invisible dedicada a “ciencias sociales”) que habrán de traer el orden de nuevo. Lo bueno del caso es que Isaac Asimov pone en clave de ciencia ficción un debate vital a nivel filosófico, que había sido el campo de batalla entre las sociedades que apoyan el historicismo y las que no (la lucha entre los comunistas, los fascistas y los capitalistas vaya): ¿pueden determinarse leyes universales para el comportamiento social? Si eso fuera cierto el comportamiento social podría ser predicho a gran escala (por eso la Segunda fundación está oculta: para que las predicciones no influyan en el propio devenir de los acontecimientos).

Esta manera de pensar ya hacía varias décadas que a Karl Popper le producía urticaria. De hecho, dedicó todos sus esfuerzos intelectuales a desmenuzar y negar cualquier cosa (desde antes de Platon hasta nuestros días) que oliera a determinismo histórico. En “La sociedad abierta y sus enemigos” destroza sin piedad a los seguidores de Platón, Aristóteles y Eurípides. En “La miseria del historicismo” ataca directamente a los técnicos del historicismo. De hecho comenta: “Es cierto que toda clase de cambio … puede representarse gráficamente. Pero es claro que …no representa lo que la gente designa como movimiento de la sociedad… Podemos combinar cualquier número de estos diagramas en una representación multidimensional. Pero un diagrama de esta clase no podemos decir que represente la trayectoria de movimiento de la sociedad… es importante decir que leyes y tendencias son cosas radicalmente diferentes”.

La negrita es mía. La he puesto porque hay una gigantesca empresa tecnológica que tiene precisamente un producto llamado Trends, y otro que se llama Domestic Trends. Me estoy refiriendo por supuesto a Google. No sé por qué lo de domestic, a mi juicio bastante modesto para lo que representa el invento. Se trata de más ni menos que partiendo de varias de esas dimensiones de las que hablaba Popper, construir predicciones de cuál va a ser el movimiento social. La tecnología de Google supera a la Filosofía, y a un debate que sustentó a nivel intelectual la Segunda Guerra Mundial y sus consecuencias.

Si Hari Seldom levantara la cabeza, podría ver que la Primera Fundación (la científica pura) se ha bastado ella solita para hacer prediciones sobre el comportamiento social, y que la segunda fundación (la de las ciencias “sin ciencia”) no era necesaria. Podría haberse ahorrado la mitad del trabajo! 

Social Media Marketing Spain alcanza los 3.000 miembros!

Domingo, febrero 14th, 2010

La comunidad basada en Linkedin interesada en la escena Social Media española ha alcanzado ya las 3.000 personas. Se trata de uno de los grupos hispanos con mayor número de seguidores en linkedin a nivel mundial.

Este grupo, gestionado por la empresa Cierzo Development, sirve de foro de encuentro de profesionales del sector para intercambiar experiencias, hacer networking, y difundir proyectos interesantes que se están haciendo en este campo, y se ha convertido en uno de los foros sociales de mayor volumen para hablar de comunicación, márketing y publicidad.

Entre los debates recientes que están teniendo lugar, se está hablando sobre la estrategia social media de Pepsi en la Superbowl, el packaging de producto, o la lucha de las plataformas de dating contra las redes sociales.

Los perfiles de los usuarios del grupo son de ejecutivos de agencias de comunicación, responsables de empresas de servicios TIC, y directores de marketing interesados en explorar posibilidades, aunque también contamos con expertos en desarrollo web, accesibilidad y usabilidad, diseño…

Os animamos a involucraros en el grupo y participar en la conversación!

ARF asegura que el análisis del sentimiento automatizado “simplemente no funciona”

Miércoles, febrero 10th, 2010

El Social Media Council de la ARF (Advertising Research Foundation) ha publicado la presentación de su última jornada, que tiene cosas bastante interesantes en cuanto al análisis del social media. ARF es una asociación muy potente que aglutina agencias de medios, anunciantes, agencias, etc. Su papel es un poco equivalente al que desarrolla en España la IAB, que cuenta con sectoriales para analizar todo lo relacionado con la publicidad.

En concreto el panel de social media deja en su presentación dos cosas interesantes:

- Cita a Cierzo Development (Smmart) como uno de los proveedores de este tipo de servicios en su página 52, dentro de un listado extraido del famoso Social Media Monitoring Wiki, en el cual figuramos desde hace casi un año (siempre es agradable que se acuerden de uno :) .

- Afirma tajantemente que el análisis del sentimiento automatizado no funciona y propone aproximaciones diferentes al problema, bastante coincidentes con la metodología que aplica Cierzo a la producción de este tipo de informes. En concreto dice en su página57 :

“La pura verdad: El análisis del sentimiento automatizado no funciona. Forrester le da una precisión del 50%, el lanzar una moneda al aire esencialmente”

Google Squared, una bomba silenciosa

Lunes, febrero 8th, 2010

Impresionante esta herramienta de Google. Se llama Google Squared y deja entrever hasta que punto ha llegado en el tema del análisis semántico: mucho más lejos que sus competidores, pero mucho menos de lo que la gente sueña.

Aquí os pongo un ejemplo con líderes políticos.
Lo interesante del caso es:
- sabe identificar elementos dentro de un texto que son del mismo tipo
- sabe identificar cuales son los atributos que se pueden extraer de dichos elementos (las columnas)

Es una demostración de fuerza bastante importante que ya habíamos visto por ejemplo en el caso de Swotti, sólo que en este caso el dominio se crea automáticamente (en el caso de Swotti, un humano decide hacer un análisis de móviles, y determina los atributos a analizar, y las frases que se utilizan en dichos atributos; en el caso de Google Squared, esto se hace automáticamente lo que permite analizar microsegmentos sin necesidad de un analista).

Ejemplo de móviles con análisis previo Swotti
Ejemplo al vuelo con Google Squared
Ejemplo de un microsegmento (demostración de que Google no ha puesto analistas para definir los dominios más usuales)

Prensa escrita: problemas y soluciones

Viernes, febrero 5th, 2010

A principios de este siglo trabajé durante 2 años para un medio de comunicación antes de fundar mi propia empresa: Cierzo Development. Todos estos años he seguido con interés la evolución del que fue mi sector desde su apogeo como cuarto poder hasta su triste decadencia, que apunta a una pérdida paulatina de peso económico y lo que es más grave de función social.

Cierzo Development desarrolló durante estos años una plataforma de rastreo de información en internet llamada Smmart, y usualmente hacemos seguimientos para gabinetes de comunicación en blogs, foros, y por supuesto medios digitales. Cuando recopilamos el clipping para el cliente … ¿saben lo que nos encontramos en el caso de medios digitales? La trasposición literal, una y otra vez de la misma nota de prensa de agencia. Al parecer, en los últimos tiempos los medios de comunicación se diferencian únicamente en su capacidad de anteponer un titular escandaloso según su sesgo político y sin ningún tipo de enriquecimiento. Esa es toda su diferenciación, eso el por lo que les pagan. Analicémoslo:

- Titular escandaloso. Esto es vital, para que una noticia alcance las primeras posiciones de agregadores como Google News o Meneame debe de ser provocador. Cuanto más distorsionemos la noticia original mejor. Si el titular es llamativo incrementamos además su viralidad por las redes sociales como twitter o facebook.
- Sesgo político. Esto no es algo de nuestros tiempos, pero es verdad que el sesgo de los medios de comunicación ha alcanzado cotas épicas. Hace tiempo que no interesa lo que un periódico tiene que decir a la sociedad como medio, pues está completamente sesgado políticamente y está completamente patrocinado a nivel comercial. El Mundo o El Pais, cada uno tiene sus deudas. Si leo al Periódico de Aragón, me interesan algunas de sus firmas, porque me han demostrado su capacidad de análisis, y me importa lo que piensan aunque les sienta amordazadas. Si leo a H. Menendez en el Heraldo de Aragón me interesa lo que dice. Porque sé que sabe de economía, porque sé que está bien informado de la realidad aragonesa aunque no pueda decirlo todo. El resto de páginas económicas del domingo no me interesan tanto: puedo encontrar la misma información repetida una y otra vez en cientos de sitios gratuitos, incluida su propia web.
- Ningún tipo de enriquecimiento. Parece ser que la prensa todavía no ha constatado que la única manera de no quedarse fuera de la cadena de valor es aportar valor. Cuando un periodista coge una nota de prensa del INE sobre la evolución del paro y la transcribe tal cual en su medio digital está lanzando el siguiente mensaje: como no puedo aportar nada de valor, coloco esto aquí gratis. Tal cual. Al lado de cualquier dato estadístico, sería genial ver su correspondiente gráfica. Sólo con eso, un diseñador justificaría completamente su sueldo, aportando algo de valor a la información original. Sin embargo, lo que vemos es una continua sucesión de afirmaciones redundantes, que demuestran que el autor desconoce lo que es un dato actual, una media móvil ó una media anualizada. “el dato del paro en este trimestre empeoró un 0,3% respecto del trimestre anterior” “la evolución interanual fue del 4,2%” “la serie desestacionalizada indica una tendencia negativa del 3,5%”…Nos repiten una y otra vez los diferentes puntos de vista de la evolución de la serie como si fueran informaciones adicionales!! Pongan un puñetero gráfico y nosotros haremos todos esos análisis!

La verdad es que ver como esta profesión ha ido perdiendo su credibilidad y quedándose atrás de la revolución de internet es muy penoso para los que nos importa su función social. Estamos perdiendo un contrapeso de los poderes públicos y lo estamos haciendo a cambio de nada. Los medios y los excelentes profesionales que trabajan para ellos están cada vez más cautivos de los intereses económicos de sus accionistas y patrocinadores. Me consta que muchos periodistas que lucharon duro en sus medios durante la transición porque pensaban que su trabajo podía cambiar el mundo, han sido convertidos a meros autómatas que van cada día con tristeza a un trabajo que ya no les ilusiona, porque lo que ellos hagan ya no cambia nada: ya no son una causa, son sólo una consecuencia.

Parece mentira que una profesión que puede estar orgullosa de haber ayudado a encauzar y moldear el camino de la democracia, a alcanzar cotas de bienestar impensables para nuestros abuelos, que puede poner en su haber el haber liderado la consiguiente revolución social, sexual y cultural de aquellos maravillosos años, esté ahora en la situación de rehén económico en la que se encuentra. Parece mentira que después de aquello el último reto intelectual fuera derribar los coletazos del felipismo a golpe de titular. Y después de eso la nada. Titadine y Gurtel, como mantra de tu respectiva tribu. ¿Para eso estudiaste en la facultad periodista? Soñabas con transformar la sociedad y eras el más revolucionario de tu clase; ahora eres el más alienado de los proletarios. ¿Cómo han podido cambiar tanto las cosas en sólo 20 años?

Algunas propuestas

Desde la posición que ocupamos podemos ver algunas posibles soluciones, y me gustaría compartirlas con el ánimo de defender una conquista social de hace dos siglos, que se está esfumando a marchas agigantadas.

A nivel financiero, me gustaría que los medios de comunicación cumplieran una función social, y por eso creo que deberían estar fuertemente subvencionados. Entiendo que es un tema sonrojante hablar de financiación de medios de comunicación, pero más sonrojante es leer los titulares cada día de la prensa y preguntarse qué queda de la libertad de prensa. Prefiero pagar con el dinero de mis impuestos para que los periodistas cumplan la función social para la cual les prepararon en la facultad que ver como les obligan a no aportar valor, lo que en última instancia es su extinción segura en el medio plazo.

A nivel tecnológico, los medios digitales tienen que subirse al carro de internet definitivamente. No es comprensible que los medios digitales no cuenten todavía con tecnología de rastreo de la información que se está produciendo en internet, que no monitoricen lo que se dice de los partidos, de las empresas, de las personas, en los medios sociales, en los foros, en los comparadores de opinión, en la blogosfera… Para cubrir ese campo tan amplio se necesita tecnología para orquestar esos volúmenes de información. ¿Qué medios de comunicación tienen hoy en día tecnología de rastreo? Hay que tener en cuenta fenómenos como Meneame, donde los propios usuarios suben contenidos y la elección de la portada se determina mediante un algoritmo, incluso las noticias potencialmente polémicas o poco contrastadas se detectan automáticamente mediante un algoritmo. Lo mantiene una persona y genera tanto tráfico como un medio de comunicación. Empiecen a pensar …¿cómo puedo aportar más valor que eso con mi plantilla de 100 personas? Desde luego, lo que no es factible es tener a un licenciado en periodismo dedicando su jornada laboral a navegar por internet sólo para ver “que se cuece por ahí”. La buena noticia es que la tecnología puede ser usada para realizar esa labor, y levantar señales en lo que se conoce como “trending tópics”.

En cuanto a los periodistas, habría que definir qué es un periodista. Una persona informada de la realidad, que enriquece una noticia (aunque en un principio no sea suya), que da contexto, que valida la fuente, que ofrece los distintos puntos de vista de manera proporcional a su representatividad (y no al sesgo político del medio): eso es para mí un periodista, uno además que aporta valor. Un autónomo mal pagado, gestor de notas de prensa, que cortapega el teletipo de europapress al sistema de publicación del periódico y añade un titular gracioso o polémico, pues eso señores para mí es un documentalista, uno malo además. Estaría muy bien ver en las noticias siempre la opinión firmada de la persona que más sepa en el periódico sobre la noticia. Me interesa saber quien lo firma porque quiero interpretar la noticia desde su punto de vista. Si van a poner en un medio impreso una noticia de ayer sin un análisis en profundidad o una firma, por favor no se molesten. Ya leí en Meneame la noticia a través de mi Iphone a los 10 minutos de que se produjera, a la hora seleccioné en Google News el medio que daba un titular con la impresión de estar mejor informado, y mi sistema de alertas me ha advertido de todas las actualizaciones de la información. Si no van a aportar valor quítense del medio (nunca mejor dicho).

Y por último en cuanto a los usuarios, los medios de comunicación deberían de tener impreso en sus fondos de pantalla el enlace de la wikipedia al término Crowdsourcing. Parece mentira que a estas alturas de la película se considere participación social que un grupo de trolls mediatizados cuelguen sistemáticamente 200 comentarios de cada noticia que se publique. ¿Es eso todo lo que podemos hacer para fomentar la participación de los ciudadanos en la gestión de la inteligencia colectiva que es internet? ¿Esas son todas las alternativas tecnológicas que se nos ocurren? ¿Por qué no se implementan en los medios de comunicación mecanismos para que los usuarios que dejan comentarios tengan reputación? ¿Por qué no se implementan mecanismos de gestión de la visibilidad de los comentarios? ¿Por qué no se experimentan otras formas de participación social? Salgan tecnológicamente del B2C, bienvenidos al P2P, internet hizo esta revolución hace 5 años, ya les va tocando a ustedes.

Acabo con una frase del cluetrain manifesto que resumen los retos que tenemos por delante: “Los hiperenlaces socavan las jerarquías”.

Actualización 11/2/2010. Leo un post bastante coincidente con este en el blog Chapapote discursivo.

¿qué reputación tiene mi empresa en internet?

Martes, noviembre 24th, 2009

Hoy el Heraldo de Aragón publica un artículo sobre Cierzo Development y Smmart, y de la importancia que está alcanzando para empresas e instituciones la reputación online.

También habla brevemente de nuestro nuevo proyecto de investigación GAMO, que permitirá desarrollar acciones de marketing digital a las empresas de los sectores más tradicionales.

Puede descargarse el PDF aquí.

3sme

Ver las redes sociales ó The stages of listening

Lunes, noviembre 16th, 2009

Daniel Vallés publica en El diario del alto Aragón un interesante artículo sobre ‘Ver las redes sociales’, en el que cita a Smmart como herramienta puntera y a Cierzo Development como proveedor que las empresas pueden utilizar para avanzar en lo que se ha venido a denominar web social.

Para Daniel, la estrategia progresiva que deben de seguir las empresas para trabajar internet pasa por:
1. Mirar páginas webs
2. Tener página web
3. Trabajar la página web
4. Escuchar las redes sociales
5. Estar en las redes sociales
6. Trabajar las redes sociales

Me ha recordado un poco un excelente artículo ‘Evolution: The eight stages of listening‘, que tiene su particular visión de como las empresas van adquiriendo experiencia en este asunto:
1. Sin objetivos
2. Siguiendo las menciones a su marca
3. Identificando riesgos de mercado y oportunidades
4. Mejorando la eficiencia de sus campañas
5. Midiendo el nivel de satisfacción del cliente
6. Respondiendo a las quejas de los usuarios
7. Entendiendo mejor a los clientes
8. Siendo proactivo y anticipándose a las necesidades de los clientes

Al final, lo que estamos viendo es que nos encaminamos cada vez a pasos más veloces al CRM social.

El inmenso campo de la recuperación de información en internet

Miércoles, noviembre 11th, 2009

La recuperación de información en internet y explotación de dicha información es un campo de infinitas posibilidades. Actualmente se multiplican los proyectos basados en crear valor mediante agregar información disponible en otras fuentes y explotar dicha información, y varios informes de consultoras lo señalan como uno de los campos donde se va a producir un crecimiento mayor en los próximos años.

Para entender la escena es necesario tener en cuenta los triggers tecnológicos que se han producido. Por un lado, la disminución del tamaño de la electrónica a un ritmo vertiginoso, conocido como ley de moore, hace accesibles incluso para pequeñas empresas enormes cantidades de capacidad de proceso, almacenamiento y ancho de banda.

Estas pequeñas empresas tenían que lidiar todavía con un importante problema: la escalabilidad. Sin embargo, la arquitectura en la nube ha barrido también esa frontera. En Cierzo Development podemos levantar hasta un centenar de servidores en menos de 10 minutos si se produce un pico de demanda de nuestros clientes. Antes, hubiéramos necesitado un espacio físico, hardware, licencias, administración, personal…. ahora todo esta en la nube. Podemos competir en calidad de servicio con empresas de 100 veces más tamaño que nosotros escalando de manera muy proporcional a la demanda.

Otro trigger tecnológico ha sido la disponibilidad de información en la red. Históricamente, la información se explotaba allí donde estaba. Los científicos que aparecen en la película Ágora no podían estar en cualquier lugar. Si la biblioteca estaba en Alejandría, aquellos que querían explotar su información debían estar en Alejandría. Desde hace 15 años la información disponible en internet crece exponencialmente. Todo se vuelca a la red: textos, bases de datos, fotografías, vídeos, etc. Es un enorme campo para explotar. Es como el lejano oeste en el que todo son nuevas fronteras para los exploradores. Al fin y al cabo, eso es una araña, o spider, un explorador automatizado que viaja por la red a ver lo que encuentra.

El último trigger es el software libre. Sistemas operativos, bases de datos… todo software libre. Pero incluso a nivel funcional más concreto en cuanto a recuperación de información: crawlers, parseadores, tokenizadores…. todo todo todo software libre, en un movimiento imparable que sobrepasa la capacidad de producción de software incluso de grandes empresas como Microsoft o Google. Esto hace que el punto de salida para una startup sea la construcción de valor, y no la construcción de infraestructura. Gracias al código libre disponible el time to market de una startup en cuanto a desarrollo de producto se acorta sustancialmente. Cuando Cierzo Development comenzó a desarrollar sistemas de IR para internet estuvimos visitando una empresa que había puesto a 6 informáticos durante 9 meses para desarrollar un sistema… de base de datos distribuida, lo cual iba a ser para ellos una gran ventaja competitiva … mmm … señores … conocen ustedes Hadoop? … se han dado una vuelta ultimamente por los servicios escalables big table que están comenzando a ofrecer Google o Amazon? El software libre nos permite concentrarnos únicamente en las funcionalidades que el usuario final va a percibir, y elimina de nuevo una ventaja competitiva de las grandes respecto a las pequeñas. La competición se centra en el conocimiento y la creatividad, y no en la fuerza bruta. Como startup, estamos acostumbrados a que empresas mucho más grandes se acerquen a nosotros “a inspirarse”, por decirlo muy respetuosamente. Su gran infraestructura se ha comido toda la creatividad y valentía de sus miembros.

Con estos cambios en tan solo pocos años no es de extrañar que el campo de la recuperación de información en internet esté creciendo increiblemente. Según botsvsbrowsers.com, actualmente hay ahí fuera más de 3500 robots conocidos, 10.000 desconocidos, y cerca de 300.000 agentes web!
Tenemos probablemente 10.000 empresas rastreando internet para generar valor añadido en el conocimiento volcado en la red en ámbitos muy diferentes de especialización. Esto es una barbaridad! Generar conocimiento es muy valioso para una civilización, pero ordenarlo y agregarlo lo es todavía más, porque amplía la base de la pirámide social y por lo tanto la hace más eficiente.

Este es un movimiento que va a continuar en los próximos años. Recuperación de información en internet (web information retrieval) y la explotación de dichos datos mediante minería de datos (data minning, text minning, semantic analysis) serán campos de un tremendo auge donde veremos nacer las próximas Google.

El grupo de escucha activa de FICOD supera el centenar de admiradores

Lunes, noviembre 9th, 2009

El próximo día 19 de Noviembre presentaremos en el FICOD nuestra aplicación de escucha activa que mediante técnicas de web semántica, analiza y valora lo que se dice de una organización en Internet. SMMART es una herramientas que proporciona una visión actualizada permanentemente de la marca, por ejemplo en redes sociales, permitiendo identificar qué se está diciendo sobre ella y así poder tomar decisiones estratégicas.

Taller “Escucha activa y web semántica para administraciones públicas y empresas“, el próximo 19 de noviembre a las 12:00 h. en el FICOD (Palacio de Congresos, Campo de las Naciones). Si estás interesado puedes unirte a la página de Facebook, que ya ha superado el centenar de fans.

FICOD es el Foro Internacional de Contenidos Digitales, que organizan el Ministerio de Industria, Turismo y Comercio, la Secretaria de Estado de Telecomunicaciones y Red.es, con el el objetivo de potenciar la industria española de contenidos digitales: cine, televisión, ocio digital, educación, producción audiovisual, redes sociales, blogs, etc. Ya se han acreditado más de 9.300 congresistas y 300 medios de comunicación.

Más información en la web de FICOD2009