Arcul este o extensie open source Apache Nutch (un popular motor de căutare extrem de scalabile, de uz general) pentru căutare intranet. Nu este fericit cu motorul dvs. de căutare corporativă? Nu este surprinzător, foarte puțini oameni sunt. Pentru cele mai bune din cunoștințele noastre, nu există motoare de intranet, care funcționează precum Google de căutare Web la nivel mondial face. Există un motiv fundamental pentru acest lucru: algoritmii utilizați de Google pe Web la nivel mondial (sau similar) nu funcționează aproape la fel de bine pe intranetul pentru lipsa datelor statistice. Arc (în sfârșit!) Rezolvă această problemă. Acesta folosește o nouă metodă pentru a obține rezultate de înaltă precizie de căutare care funcționează mare. Nu crezi? instrumente de evaluare de testare oarbe sunt incluse. Aveți posibilitatea să implementați Arch și compara performanțele sale la motorul dvs. de căutare curentă și / sau Google (pe partea publică a site-ului dvs.), folosind o metodologie de testare orb.
În plus față de calitatea de căutare excelenta, Arch are multe caracteristici esențiale pentru mediile corporatiste:
- Nivelul de securitate Document. Utilizatorii pot găsi numai documentele pe care sunt autorizați să vadă.
- Actualizări de index necostisitoare. Arcul este capabil să țină indexurile până în prezent și de a evita regulate site-ul complet Reaccesarea cu crawlere.
- 24/7 availabilty. Există întotdeauna un index de lucru disponibile, chiar dacă un crawl eșuează.- Suport pentru indexarea simultană și căutarea de mai multe site-uri web, cu capacitatea de a căuta și de a administra orice site separat, dacă este necesar. Dinamică adăugarea și îndepărtarea de site-uri web este ușor.
- Un director site-ul generat automat.
- Suport cost redus odată dislocat.
- Interfață dublă (PHP și Java) pentru implementare ușoară și personalizare.
- Fațetată search "out of the box".
- Un set extins și extensibil de interpretoare pentru parsarea o varietate de formate de fișiere: HTML, PHP, PDF, MS Office, Open Office, etc.
- O, arhitectură modulară bazată pe plug-in care poate fi personalizat cu ușurință și extinse.
- Codul sursă este inclus.
- Înaltă performanță și scalabilitate. Arc poate rula pe clustere de calculatoare la index seturi de date foarte mari
Ce este nou în această versiune:.
Versiunea 1.9.2: parsarea documentului îmbunătățit, portat pe Nutch 1.9 .
Ce este nou în versiunea 1.7:.
scanare de securitate, portat pe Nutch 1.7
Cerințe :
Java 1.7, Cygwin
Comentariile nu a fost găsit