Recoll: Xapian vs Lucene
Java, Linux/OpenSource April 24th, 2007Beagle ist sicherlich die bekannteste Desktop-Suche für Linux, doch mehrfache Tests haben die Mono/.net Anwendung Beagle als unbrauchbar für meine Zwecke klassifiziert. Zu langsam, zu hoher Speicherverbrauch.
Jetzt bin ich über eine andere „Suchmaschine“ für den Desktop gestolpert – Recoll. Anders als Beagle – und viele, viele andere Anwendungen – wird bei Recoll nicht Lucene (oder eine Portierung) eingesetzt, sondern die mir bis jetzt unbekannte Xapian Library.
Xapian ist eine unter der GPL stehende Library, die ähnliche Ziele verfolgt, wie Lucene, wurde jedoch ursprünglich für C++ und nicht (wie Lucene) für Java entwickelt. Inzwischen gibts es auch hier Portierungen für Java (via JNI *hust*), C#, PHP, Python und weitere Sprachen.
Leider konnte ich bisher keine vernünftige Evaluation von Xapian vs. Lucene finden – sicherlich ist für den einen oder anderen bei der Auswahl eines zu integrierenden Software-subsystems interessant, welche spezifischen Vor- und Nachteile es gibt. (Ohne Flamewars lostreten zu wollen)
Es gibt zwar dies – offensichtlich veraltete – Paper, doch sind die darin zu findenden Aussagen etwa auf dem Stand von Ende 2003, schon auf den ersten Blick fällt auf, daß dies nicht mehr den aktuellen Stand wiederspiegelt.
Evtl. werde ich dazu selber etwas ergänzen, sobald ich Xapian vs. Lucene eine faire Testumgebung gebaut und ggf. eigene Tests gemacht habe.
Interessant ist Recoll aber für jeden, der sich für Desktop-Suche unter Linux interessiert. Auf meinem Ubuntu Feisty 64bit System ließ sich das Debian amd64 Paket einwandfrei und direkt installieren. (Für Ubuntu gab es nur ein edgy Paket für die i386 Plattform)
Im Einsatz besticht Recoll durch hohe Geschwindigkeit, gute Ergebnisse, bietet jedoch eine eher sehr funktionale GUI.
Neue Kommentare