* * * * *

Caso práctico: “Pseudo fields” en Solr

Una de las debilidades de Solr es no disponer de soporte directo para poder añadir en las respuestas campos que no estén almacenados en el índice de búsqueda. Aunque su arquitectura es muy flexible y permite añadir nuevos componentes desarrollados por el usuario, no facilita a esos componentes la tarea de enriquecer los resultados. Para comprender esta limitación, desarrollaremos un caso práctico junto con la solución que hemos aplicado en OSP (Open Search Platform).

Nota: el soporte para pseudo fields parece [...]

20 febrero, 2012 a las 18:17

Sistema de búsqueda en singulares y plurales

Sorprende ver el empeño que últimamente empresas como Google o Yahoo! están poniendo en patentar utilidades que en principio son cosas comunes a muchos motores de búsqueda, considerad por ejemplo, la patente conseguida por Google llamada Method and apparatus for output of search results en la que se explica cómo mostrar los resultados (en modo lista y modo parrilla) de un buscador que devuelve resultados de tipo “producto”.

Como este hay más ejemplos, entre ellas, a nosotros nos ha llamado especialmente [...]

28 diciembre, 2011 a las 11:14

DokuWiki: generar índice y buscar

Cuando necesitamos encontar algo en nuestra wiki y esta es ya muy extensa, puede ser útil utilizar el cajón de búsqueda que presenta DokuWiki y que nos permite buscar en el contenido de nuestras páginas.

DokuWiki agrega y/o actualiza la información sobre el contenido de una página en el momento de ser creada o cada vez que esta es vista por un usuario.

En el caso de que sus páginas se creen desde un editor externo o con algún proceso automático, la [...]

2 noviembre, 2011 a las 10:59

Lucene Eurocon 2011: The Big Picture

Ya pasados unos días hacemos una retrospectiva de lo mejor y lo peor de la Apache Lucene Eurocon 2011 en cuanto a los asistentes, ponencias, la formación y las instalaciones.

Las instalaciones

El hotel escogido para el evento fue el Meliã Barcelona, cerca de la Diagonal. Todas las salas, menos una, gozaban de una amplitud bastante buena, además tenían unas pantallas a lo largo de la sala para aquellos que estuviesen lejos del proyector y no viesen con claridad. El sonido era [...]

23 octubre, 2011 a las 23:08

Lucene Eurocon 2011: Conferencias

Y llegó el gran día: el primer día de conferencias. El plantel de este primer día prometía mucho: Grant Ingersoll, Eric Baldeschwieler, Mark Millar o el gran Hoss (Chris Hostetter). Las sesiones se dividían en tracks, por cada uno de esos tracks existían tres sesiones paralelas. Aunque las salas diferían bastante en aforo, la más interesante no siempre estaba en la sala más grande; por desgracia.

El día comenzaba con la keynote de apertura de Ingersoll con el título Search + Big [...]

20 octubre, 2011 a las 21:21

Lucene Eurocon 2011: Día 2

Llegamos con más energía que el primer día. Habíamos dormido más y ya estábamos ‘ready to rumble‘. Además, hoy era EL día, hoy tocaba la clase práctica que estábamos esperando.

El instructor de hoy no es el mismo que el del primer día. El de hoy es Ken Krugler, comitter del proyecto de Apache Tika y CEO de Bixo Labs. La clase empieza y nos aconseja que, aunque sabe que a veces es imposible, dejemos el correo y la mensajería de [...]

18 octubre, 2011 a las 20:08

Lucene Eurocon 2011: Día 1

Hoy se inaugura la Lucene Eurocon 2011 en Barcelona, en el hotel Meliã Barcelona. Los dos primeros días están dedicados a un conjunto de formaciones de lo más variadas; desde los primeros pasos con Lucene hasta otras más avanzadas como escalado de Solr y utilización de Hadoop.

Al evento acudimos Benito y yo para asistir tanto a la formación como a las conferencias los días siguientes. El precio, a priori, puede parecer un tanto elevado aunque vista la organización, el lugar, los ponentes [...]

17 octubre, 2011 a las 18:56

Introducción al Scoring en OSP y Solr

En repetidas ocasiones un proyecto de búsqueda fracasa porque el cliente y el proveedor no hablan el mismo lenguaje. No sirve de nada disponer de una tecnología de búsqueda potente, si no se consigue que el cliente comprenda cómo le puede sacar partido mediante la explotación de sus propios contenidos.

Por norma general, se ve un buscador como una caja negra en la que se introduce una o más palabras y este devuelve documentos que contienen esas palabras. Sin embargo, pocas [...]

6 octubre, 2011 a las 10:01

Nueva funcionalidad de búsqueda: Subquery Faceting

Desde Colbenson tenemos el placer de comunicar el lanzamiento de una nueva funcionalidad dentro de nuestra plataforma de búsqueda OSP (Open Search Platform). La hemos bautizado como Subquery Faceting y consiste en devolver los resultados de una búsqueda agrupados por los términos que constituyen la misma. Por ejemplo, ante la búsqueda ["vestido corto" a rayas] debería devolver, además de los resultados propios de la búsqueda, el número de resultados en los que aparece la frase ["vestido corto"], y el número [...]

23 agosto, 2011 a las 11:57

Introducción al API de extracción de datos de Google Analytics

En este post vamos a tratar de forma sencilla el uso del api de extracción de datos de Google Analytics mediante un cliente java que la propia Google nos proporciona.

En este post se hace referencia al API v2 de la librería cliente de Java, si se produjese algún cambio de versión las instrucciones contenidas en este documento deberían ser revisadas para comprobar que se adaptan a los cambios introducidos en la nueva API.

Conceptos previos:

Para comenzar vamos a ver un poco en [...]

15 julio, 2011 a las 19:41