Arch Search Engine 1.15

Lizenz: kostenlos ‎Dateigröße: 31.07 MB
‎Benutzerbewertung: 3.5/5 - ‎2 ‎Stimmen

Arch ist eine Open-Source-Erweiterung von Apache Nutch (eine beliebte, hochgradig skalierbare Allzweck-Suchmaschine) für die Intranetsuche. Sie sind nicht zufrieden mit Ihrer Unternehmenssuchmaschine? Es überrascht nicht, dass nur sehr wenige Menschen es sind. Nach bestem Wissen und Gewissen gibt es keine Intranet-Engines, die so gut funktionieren wie die globale Websuche von Google. Dafür gibt es einen wesentlichen Grund: Die Algorithmen, die Google im globalen Web (oder ähnlichem) verwendet, funktionieren in Intranets mangels statistischer Daten nicht annähernd so gut. Arch (endlich!) löst dieses Problem. Es verwendet eine neuartige Methode, um hochpräzise Suchergebnisse zu liefern, die großartig funktionieren. Glauben Sie es nicht? Blindtest-Evaluierungstools sind enthalten. Sie können Arch bereitstellen und seine Leistung mit Ihrer aktuellen Suchmaschine und/oder Google (im öffentlichen Teil Ihrer Website) mit einer Blindtestmethodik vergleichen. Neben der hervorragenden Suchqualität verfügt Arch über viele Funktionen, die für Unternehmensumgebungen von entscheidender Bedeutung sind: - Sicherheit auf Dokumentebene. Benutzer können nur Dokumente finden, für die sie berechtigt sind. - Günstige Index-Updates. Arch ist in der Lage, Indizes auf dem neuesten Stand zu halten und regelmäßige vollständige Site-Recrawling zu vermeiden. - 24/7 Verfügbar. Es ist immer ein funktionierender Index verfügbar, auch wenn eine Durchforstung fehlschlägt. - Unterstützung für die gleichzeitige Indizierung und Suche mehrerer Websites, mit der Möglichkeit, jede Website separat zu durchsuchen und zu verwalten, falls erforderlich. Dynamisches Hinzufügen und Entfernen von Websites ist einfach. - Ein automatisch generiertes Standortverzeichnis. - Kostengünstiger Support nach der Bereitstellung. - Dual-Schnittstelle (PHP und Java) für einfache Bereitstellung und Anpassung. - Facettierte Suche "out aus dem Kasten". - Ein umfangreicher und erweiterbarer Satz von Parsern zum Analysieren einer Vielzahl von Dateiformaten: HTML, PHP, PDF, MS Office, Open Office, etc. - Eine modulare, Plugin-basierte Architektur, die einfach angepasst und erweitert werden kann. - Der Quellcode ist enthalten. - Hohe Leistung und Skalierbarkeit. Arch kann auf Computerclustern ausgeführt werden, um sehr große Datensätze zu indizieren.

VERSIONSVERLAUF

  • Version 1.15 veröffentlicht auf 2019-05-17
    Portiert auf Nutch 1.15
  • Version 1.9.2 veröffentlicht auf 2016-08-18
    Verbesserte Dokumentanalyse, portiert auf Nutch 1.9.
  • Version 1.2 veröffentlicht auf 2010-09-17
    Portiert auf Apache Nutch 1.2, aktualisiert eedupnet emittiert den PDF-Parser, hinzugefügt Test-und Tuning-Tools, behoben Probleme in der Beta-Version gefunden, aktivierte Verwendung von Computer-Cluster.

Programmdetails