Emdros este un motor de baze de date de text Open-Source pentru stocarea și regăsirea de texte analizate sau adnotat.
Emdros are un puternic limbaj de interogare pentru a pune întrebări relevante ale datelor.
Emdros are aplicabilitate larga in domenii care se ocupă cu textul analizat sau adnotat. Domenii de aplicare includ lingvistica, publicarea, de prelucrare de text, precum și orice alte domenii care se ocupă cu text adnotat.
Emdros oferă un model conceptual de text care poate fi destul de eliberatoare a utiliza după ce a fost înțeles.
Meta-date pot fi de asemenea stocate, atâta timp cât nu există un element textual cu care poate fi asociată.
Emdros este bun atât pentru lingvistica corpus (cantități mari de text) și pentru teren-lingvistică (cantitati mai mici de date).
Fix corpora, cum ar fi texte biblice, sunt buni candidați pentru a face Emdros util. Emdros este in prezent utilizat pentru baze de date mari ale Bibliei ebraice.
Dicționare sunt, de asemenea, o posibilitate țintă. Emdros sprijină structurarea documentelor text în jos pentru detalii minut, în timp ce nu pierde imaginea de ansamblu.
Emdros întruchipează un anumit model de text numit modelul EMdF. Avantajul principal pe modelul de date XML este că tipuri de obiecte (cum ar fi pagini și capitole) nu trebuie să fie structurate ierarhic sau încorporate, dar se pot suprapune. În plus, obiecte (cum ar fi o clauză sau o expresie) nu trebuie să fie contigue, dar poate avea lacune.
Emdros poate de ieșire rezultatele sale în XML. XML poarta propria DTD independent și validează cu un parser de validare.
Arhitectura Emdros
Emdros potrivește într-o arhitectură software, după cum urmează:
+ --------------- +
| Client | scris de utilizare
+ --------------- +
|
+ --------------- +
| MQL | Emdros
+ --------------- +
|
+ --------------- +
| EMdF | Emdros
+ --------------- +
|
+ --------------- +
| DB | PostgreSQL sau MySQL
+ --------------- +
În partea de sus, este un client care, utilizatorul trebuie să scrie. Acest client va beneficia de serviciile Emdros de a oferi pentru nevoile domeniului bazei de date particlar.
Apoi vin cele două Emdros-straturi: Stratul de MQL și stratul EMdF. Stratul de MQL oferă o interfață cu limba MQL. Stratul MQL preia automat profită stratului EMdF, care se traduce interogările MQL în SQL apeluri la baza de date care stau la baza.
Baza de date care stau la baza se ocupa de stocarea datelor, și recuperarea o ca regia de către stratul EMdF.
Domeniul de date care se ocupă Emdros este cea a textului. Emdros oferă o anumită abstracție de text care face ideal pentru stocarea și regăsirea de text adnotat, cum ar fi analize lingvistice ale unui text.
Aceste analize pot fi, de exemplu, analize sintactice, analize morfologice, sau analize de discurs, sau toate acestea. Analizele fonologice sunt de asemenea suportate într-o anumită măsură.
Emdros este deosebit de util în domenii în care întrebările de cercetare trebuie să fie întrebat de baze de date de text adnotat. Aceasta ar include dicționar de luare, biblice limba cercetare (greacă sau ebraică), alte cercetari lingvistice, precum și de cercetare pe textul adnotat, în general.
Emdros are un model de text numit modelul EMdF. Utilizatorii au atestat, și experiența noastră arată, că modelul EMdF poate fi destul de eliberator atunci când se ocupă cu textul ca un programator sau un program de designer. Astfel, orice aplicație care se ocupă cu textul adnotat vor beneficia probabil de Emdros și modelul EMdF
Caracteristici :.
- analize lingvistice sunt domeniul țintă primar. Aceasta include toate nivelurile de analiză, cum ar fi morfologie, sintaxa, și analiza discursului, și chiar fonologie-o anumită măsură.
- Publishing este, de asemenea, un domeniu în care Emdros pot fi utile. Emdros sprijină rupere jos un text în pagini, capitole, paragrafe, etc.
- procesare text pot beneficia de Emdros dacă problema implică adnotare textul.
Ce este nou în această versiune:
- a fost adăugat suport experimental pentru căutare în text complet
- În RenderObjects și caracteristicile RenderXML au fost consolidate.
- S-au obținut îmbunătățiri generale de viteză.
- Suport a fost adăugat pentru a construi pe distribuțiile recente de Linux, precum și suport pentru construirea de qmake.
Ce este nou în versiunea 3.2.0:
- modernizate pentru SQLite 3.6.17 și PCRE 8.01.
- TIGERXML importatorul este acum mult mai indulgentă față de intrare.
- Query Tool Emdros poate acum de ieșire în format XML, si poate crea PNG din linia de comandă.
Ce este nou în versiunea 3.1.0:
- Remedii erori:
- bug de lungă durată, # 1217003 pe Emdros bug tracker SourceForge.Net lui, a fost stabilit. Practic, a fost o eroare de proiectare în mod referințe obiect au fost tratate în MQL topografice. Acest lucru ar putea conduce uneori la înșelătoare și / sau rezultatele incomplete.
- Bug # 2021303 a fost stabilit. Acesta a spus că, în Query Tool Emdros, stabilind & quot; opțiune = liniștit & quot; în configurare fișier ar implica faptul că trebuia să redimensiona fereastra pentru a obține orice ieșire afișate la toate.
- accesorii de caracteristic:
- Query Tool Emdros este acum capabil de a salva producția sa de HTML. În cazul în care producția conține copaci, acestea sunt salvate ca PNG.
- Adăugat libharvest, care este o bibliotecă pentru & quot; recoltarea & quot; Emdros obiecte.
- Adăugat un parser JSON, utilizate în libharvest.
- Query Tool Emdros acum nu afișează nici sfaturi instrument, care utilizatorii dorit oprit.
- uzanțele de referință Object poate referi acum propriul bloc. De exemplu, acest lucru este acum posibil: [Word ca w1 // Notă modul în care acest referire același obiect pentru ambele funcții. phrase_dependent_part_of_speech = w1.part_of_speech]
- În desktop Linux, se adaugă intrări de meniu pentru Query Tool Emdros, chunking Tool Emdros, iar Import Tool Emdros.
- Query Tool Emdros și chunking Tool Emdros sunt ambele mult mai rapid la afișarea rezultatelor.
- Query Tool Emdros este acum capabil de a afișa copaci orizontale în producția sa.
- Query Tool Emdros este acum capabil de a rezultatelor de ieșire ca o concordanță KWIC (KWIC = Cuvinte cheie În context).
- MatchedObject :: getFeatureAsString () returnează acum o listă de etichete enum, mai degrabă decât o listă de numere întregi, atunci când funcția este o listă de ENUM.
- Viteza de obiecte GET CU monade IN a fost îmbunătățită.
- Importatorul TigerXML acum este capabil de a importa fișierele * .ltcx de Lingvistic copac Constructor.
- Construiți schimbări:
- gcc 4.3 este acum suportat.
- PostgreSQL versiunea 8.3 este acum versiunea acceptată numai, pe toate platformele.
- Emdros poate fi acum pe 64 de biți a construit-rpm Fedora 10.
- Emdros poate fi acum construit pe x86 Solaris.
- RPM ajunge acum identificatorul de distribuție (de exemplu, fc9), în numele RPM automat.
- Python înghițitură DLL pe Win32 este numit acum _Emdros.pyd decât _Emdros.dll.
- În Mac OS X, atât 10.4 și 10.5 sunt susținute de aceleași binare.
- wxWidgets 2.4 nu mai este acceptat; doar 2.6 și 2.8 sunt.
- În Mac OS X și Linux / Unix, non-Unicode se bazează de Emdros nu mai sunt suportate.
- înghițitură CSHARP este acum capabil de a utiliza GMCs pentru legături Net.
Comentariile nu a fost găsit