Apache Solr este un server de căutare open source, gratuit, independent de platformă și de înaltă performanță bazat pe proiectul Apache Lucene, care utilizează API XML / HTTP și JSON. Proiectul este în prezent incubat la Fundația Software Apache.
Caracteristici dintr-o privire
Caracteristicile cheie includ evidențierea succesului, căutarea fațetată, cache, replicare, o interfață de administrare bazată pe web, capabilități avansate de căutare fulltext, optimizată pentru traficul de mare volum, precum și interfețe deschise bazate pe standarde precum HTTP , XML și JSON.
În plus, acesta include interfețe de administrare HTML complete, statistici de server, replicare automată a indexului, recuperare automată și failover, indexare aproape în timp real, adaptabilă și flexibilă cu configurare XML și extensie de plugin extensie.
Proiectul este fără schemă, care permite utilizatorului să înceapă rapid cu Apache Solr. Atât schema, cât și modurile fără schemă sunt acceptate în acest moment, dar acestea vor conduce la un mediu de producție puternic.
Diferitele tipuri sunt acceptate de Solr, inclusiv tipurile de câmpuri, care vă vor ajuta să amestecați și să vă potriviți analizoarele Lucene fără să scrieți niciun fel de cod. În plus, proiectul acceptă câmpuri dinamice care pot fi activate în timp real.
Printre alte caracteristici interesante putem menționa funcționalitatea câmpului de copiere care permite utilizatorilor să analizeze cu ușurință același conținut folosind metode diferite, suport pentru tipuri explicite pentru a elimina necesitatea de a ghici tipuri de câmpuri, configurații personalizate bazate pe fișiere externe, precum și numeroasele componente suplimentare de analiză a textului.
Sub capota și disponibilitate
Privind sub capota lui Apache Solr, putem observa că aplicația a fost scrisă în întregime în limbajul de programare Java și susține distribuțiile pe 32 de biți și pe 64 de biți ale Linux, precum și Microsoft Windows și Mac OS X sisteme de operare.
Pentru confortul dvs., acesta este distribuit atât ca arhivă binară, cât și ca sursă, astfel încât să puteți începe ușor cu Apache Solr în timp cât mai scurt posibil și fără prea multă greutate.
Ce este nou în această versiune:
- Supraveghetorul nu poate procesa niciodată ultimele mesaje.
- Redenumirea miezului în modul standalone solver nu este persistentă.
- parsarea parametrilor rq ai QueryComponent nu mai ia în considerare parametrul defType.
- Fixați NPE în SolrQueryParser atunci când termenii interogării din interiorul unei clauze de filtrare se reduc la nimic.
Ce este nou în versiune:
- În plus față de multe alte îmbunătățiri din cadrul de securitate, Solr include acum un AuthenticationPlugin care implementează HTTP Basic Auth care stochează acreditările în siguranță în ZooKeeper. Aceasta este o modalitate simplă de a solicita un nume de utilizator și o parolă pentru oricine accesează ecranul de administrare al Solr sau API-urile.
- În autorizarePlugin construit, care oferă un control cu granulație fină asupra implementării ACL pentru diverse resurse cu reguli de permisiune stocate în ZooKeeper.
- API-ul JSON Facet poate schimba acum domeniul pentru comenzile fațetului, făcând în principal un bloc de conectare și mutarea de la părinți la copii sau copii la părinți înainte de a calcula datele fațetului.
- Îmbunătățiri majore în performanța noului modul Facet / JSON Facet API.
- Interogări și zone de acoperire sub pivoturi. La fel ca API-ul JSON Facet, fețele pivot pot modul în care alte tipuri de fațete cuibăresc, cum ar fi fatetele de interval și de interogare.
- Mai multe opțiuni ca parserul de interogare. MoreLikeThis QParser acceptă acum toate opțiunile furnizate de Handler-ul MLT. Parserul interogării este mult mai versatil decât cel care execută, deoarece funcționează în modul nor, precum și oriunde poate fi specificată o interogare normală.
- A fost adăugat suportul pentru schema API în SolrJ
- Modul de adăugare a punctajului pentru integrarea în interogări și blocarea conexiunii.
- Adăugat format de răspuns la zâmbet
Ce este nou în versiunea 4.10.3:
- Solr 4.10.2 include 10 remedii de eroare, precum și Lucene 4.10.2 și cele 2 remedii ale erorilor.
Ce este nou în versiunea 4.6.1:
- Apache Tika 1.4
- Morcov2 3.8.0
- viteza 1.7 și viteza de lucru 2.0
- Apache UIMA 2.3.1
- Apache ZooKeeper 3.4.5
- Remedieri de erori:
- SOLR-5408: Colapsul QParserPlugin scade incorect atunci când sunt utilizate criterii multiple de sortare
- (Brandon Chapman, Joel Bernstein)
- SOLR-5416: CollapsingQParserPlugin întrerupe Tag / Exclude Faceting
- (David Boychuck, Joel Bernstein)
- SOLR-5442: clientul Python nu poate parsa răspunsul proxy atunci când este servit de Tomcat.
- (Patrick Hunt, Gregory Chanan, Vamsee Yarlagadda, Romain Rigaux, Mark Miller)
- SOLR-5445: Răspunsurile proxy ar trebui să propagheze toate anteturile, nu prima, pentru fiecare cheie.
- (Patrick Hunt, Mark Miller)
- SOLR-5479: logica de reîncercare SolrCmdDistributor se oprește dacă liderul cererii nu poate fi găsit în 1 secundă.
- (Mark Miller)
- SOLR-5532: Validarea tipului de conținut SolrJ este prea strictă pentru unele webcontainers / proxies.
- (Jakob Furrer, hossman, Shawn Heisey, Uwe Schindler, Mark Miller)
- SOLR-5547: Crearea unui alias de colecție folosind colecția SolAdJ ColecțiaAdminRequest stabilește numele aliasului și colecțiile în alias la aceeași valoare.
- (Aaron Schram, Mark Miller)
- SOLR-5577: Expirarea probabilă a ZooKeeper nu ar trebui să încetinească actualizările unei anumite valori, ci să taie actualizările după un timp dat.
- (Mark Miller, Christine Poerschke, Ramkumar Aiyengar)
- SOLR-5580: NPE atunci când creați un nucleu cu clase explicite și coreNodeName.
- (YouPeng Yang, Mark Miller)
- SOLR-5552: Procesul de recuperare a leaderului poate selecta liderul greșit dacă toate replicile pentru un shard sunt în jos și încearcă să se recupereze, precum și să pierde actualizările care ar fi trebuit recuperate.
- (Timothy Potter, Mark Miller)
- SOLR-5569 O replică nu ar trebui să încerce să se recupereze de la un lider până când nu a publicat că este ACTIV.
- (Mark Miller)
- SOLR-5568 SolrCore nu poate decide să fie lider doar pentru că starea clusterului spune că niciun alt SolrCore nu este activ.
- (Mark Miller)
- SOLR-5496: Ar trebui să împărtășim un manager de conexiuni http pe site-urile HttpClients fără căutare și să ne asigurăm că toți administratorii conexiunilor http se opresc.
- (Mark Miller)
- SOLR-5583: ConcurrentUpdateSolrServer # blockUntilFinished poate aștepta pentru totdeauna dacă serviciul executor este oprit.
- (Mark Miller)
- SOLR-5586: Toate fișierele lui ZkCmdExecutor ar trebui inițializate cu expirarea termenului expr. client
- (Mark Miller)
- SOLR-5587: Implementările ElectionContext ar trebui să utilizeze ZkCmdExecutor # ensureExists pentru a se asigura că căile lor electorale sunt create corespunzător.
- (Mark Miller)
- SOLR-5540: HdfsLockFactory ar trebui să creeze în mod explicit directorul parental de blocare dacă este necesar.
- (Mark Miller)
- SOLR-4709: Reîncărcarea de bază după replicare, dacă fișierele de configurare s-au modificat, pot eșua din cauza unei condiții de cursă. (Mark Miller, Hossman))
- SOLR-5503: Reîncercați cererile "înainte de lider" mai puțin agresiv - mai degrabă decât pe IOException și statutul 500, ConnectException.
- (Mark Miller)
- SOLR-5588: PeerSync nu numără toate eșecurile de conectare ca succes.
- (Mark Miller)
- SOLR-5564: hl.maxAlternateFieldLength ar trebui să se aplice câmpului original când se încearcă o rezervă
- (janhoy)
- SOLR-5608: Nu permiteți unui SolrCore închis să publice stat la ZooKeeper.
- (Mark Miller, Shawn Heisey)
- SOLR-5615: Blocaj în timp ce încearcă să se redreseze după expirarea sesiunii ZK.
- (Ramkumar Aiyengar, Mark Miller)
- SOLR-5543: Swap-urile de bază au avut ca rezultat duplicate intrări de bază în solr.xml atunci când se folosește persistența solr.xml.
- (Bill Bell, Alan Woodward)
- SOLR-5618: Rezolvați false cache-uri în queryResultCache când hashCodes sunt egale și în una din cereri există interogări de filtru duplicat
- (hossman)
- SOLR-4260: ConcurrentUpdateSolrServer # blockUntilFinished poate reveni înainte ca toate actualizările adăugate anterior să fi terminat. Aceasta ar putea duce la pierderea actualizărilor distribuite destinate copiilor.
- (Markus Jelsma, Timothy Potter, Joel Bernstein, Mark Miller)
- SOLR-5645: o reîncărcare SolrCore prin intermediul CoreContainer va încerca să se înregistreze din nou cu noul SolrCore.
- (Mark Miller)
- SOLR-5636: SolrRequestParsers face unele căutări xpath la fiecare solicitare, ceea ce poate cauza probleme de concurrency.
- (Mark Miller)
- SOLR-5658: commitWithin și suprascrierea nu sunt distribuite în replici acum că SolrCloud utilizează javabin pentru a distribui actualizări.
- (Mark Miller, Varun Thacker, Elodie Sannier, Shalin)
- Optimizations:
- SOLR-5576: Îmbunătățiți concurența atunci când înregistrați și așteptați ca toate SolrCore să înregistreze o stare DOWN.
- (Christine Poerschke prin intermediul lui Mark Miller)
Ce este nou în versiunea 4.6.0:
- Multe îmbunătățiri și îmbunătățiri pentru opțiunile de divizare a șarpelui
- Noua AnalyzingInfixLookupFactory pentru a mobiliza AnalyzingInfixSuggester
- New CollapsingQParserPlugin pentru câmpurile de înaltă performanță care se prăbușesc pe câmpuri de mare capacitate
- Noi API-uri SolrJ pentru gestionarea colecțiilor
- Noua DocBasedVersionConstraintsProcessorFactory care oferă suport pentru regulile de versiune configurate de către utilizator
- Format nou de index implicit: Lucene46Codec
- Tip nou EnumField
Ce este nou în versiunea 4.5.1:
- Solr 4.5.1 conține o serie de corecții de erori, inclusiv 2 care sunt considerate destul de grave.
Ce este nou în versiunea 4.5.0:
- Suport personalizat pentru rulare, rutare îmbunătățită și fațetare cu mai multe filete.
Ce este nou în versiunea 4.2.0:
- O parte REST API citită pentru schemă. Întotdeauna a vrut să introspezi schema pe http? Acum poti. Se pare că partea de scriere va veni în continuare.
- DocValues au fost integrate în Solr. DocValues poate fi încărcat mult mai repede decât cache-ul de câmp și poate utiliza de asemenea algoritmi de compresie diferit, precum și în RAM sau pe reprezentări de discuri. Facerea, sortarea și interogarea funcțiilor fac ca toate să beneficieze. Ce zici de manipularea sistemelor de operare și de sortare a cache-urilor? Nu mai pot fi incluse 60 de gigaocteți? Ce zici de o metodă de modelare facială nouă pe segmentul DocValues? Îmbunătățirea aspectării numerice? Dulce.
- Alinierea colecției. Aveți date bazate pe timp? Doriți să re-indexați într-o colecție temporară și apoi să o înlocuiți în producție? Terminat. Rămâneți acordat pentru Alianța Shard.
- Răspunsurile colecției API. API-ul pentru colecții a fost încă foarte nou în versiunea 4.0, iar în timp ce sa îmbunătățit un pic echitabil în 4.1, răspunsurile au fost cu siguranță necesare, dar au ratat tăierea. Inițial, am luat decizia de a face colecția API de colectare super tolerantă la erori, ceea ce a făcut ca răspunsurile să fie mai dure. Nimeni nu vrea să vâneze prin fișiere de jurnale pentru a vedea cum s-au dovedit lucrurile. Încheiat în 4.2.
- Interacționează cu orice colecție din orice nod. Până în 4.2, puteți interacționa numai cu un nod din cluster dacă găzduiește cel puțin o replică a colecției pe care doriți să o interogați / actualizați. Nu mai interogați niciun nod, indiferent dacă are sau nu o parte din colecția dorită, și obține un răspuns proxy.
- Permiteți nume personalizate ale shard-urilor, astfel încât adresele gazdă noi să poată prelua fragmentele retrase. Lucrați pe Amazon fără ipsos elastic? Aceasta este pentru tine.
- Lucene 4.2 optimizări, cum ar fi vectori de termeni comprimați.
Ce este nou în versiunea 3.3.0:
- Gruparea / coborârea câmpurilor
- O nouă implementare auto-completare sugerată / automată care oferă un ordin de mărime a consumului de RAM mai mic.
- KStemFilterFactory, o implementare optimizată a unui traducător mai puțin agresiv pentru limba engleză.
- Solver implică o politică de îmbinare nouă, mai eficientă (TieredMergePolicy). Consultați http://s.apache.org/merging pentru mai multe informații.
- Bugfixuri importante, inclusiv utilizarea extrem de mare a RAM în verificarea ortografică.
- Remedieri și îmbunătățiri de la Apache Lucene 3.3
Ce este nou în versiunea 3.2.0:
- Abilitatea de a specifica suprascrierea și comiterea ca parametri de solicitare atunci când se utilizează formatul de actualizare JSON
- TermQParserPlugin, util atunci când se generează interogări de filtrare din termenii returnați de la faceting în câmp sau din componenta de termeni.
- DebugComponent suporta acum folosirea unui NamedList pentru a modela obiecte Explication in raspunsurile lui in loc de Explanation.toString
- Îmbunătățiri ale integrărilor UIMA și Carrot2
- Remedieri și îmbunătățiri de la Apache Lucene 3.2
Ce este nou în versiunea 3.2.0:
- S-au făcut îmbunătățiri ale actualizării JSON.
- Au fost îmbunătățite clustering-ul rezultatelor de căutare și integrarea UIMA.
- Au fost fixate bug-uri.
Comentariile nu a fost găsit