HOBS - sintaktička razina

Hrvatska ovisnosna banka stabala korpus je od 4.500 rečenica označenih prema modificiranoj specifikaciji Praške ovisnosne banke stabala za označavanje na analitičkoj razini. SynSem vizualizator omogućava pretragu 3.500 rečenica u kojima su označene semantičke uloge.

HOBS - semantička razina

Semantička razina Hrvatske ovisnosne banke stabala sastoji se od 3.500 rečenica označenih sa semantičkim ulogama prema specifikaciji izrađenoj za hrvatski jezik.

HR4EU korpus

HR4EU korpus sastoji se od oko 500 rečenica iz tečajeva za hrvatski jezik dostupnih na mrežnome portalu HR4EU, koji se izrađuje na Zavodu za lingvistiku na projektu financiranome od strane Europske unije, Europskog socijalnog fonda. Rečenice su označene na sintaktičkoj i semantičkoj razini prema modelu upotrijebljenome za HOBS.

Resursi

Na ovoj stranici dostupna su dva korpusa označena na morfosintaktičkoj, ovisnosnoj i razini semantičkih uloga.

Prvi je korpus izrađen u sklopu MZOŠ projekta Razvitak hrvatskih jezičnih resursa Zavoda za lingvistiku kao Hrvatska ovisnosna banka stabala. Dio je Hrvatskoga nacionalnoga korpusa, tj. dio novinskoga potkorpusa (tjednik Croatia Weekly, CW2000). CW2000 potkorpus lematiziran je i morfosintaktički obilježen u skladu s MulTextEast preporukama za hrvatski jezik, s pomoću Hrvatskoga lematizacijskoga poslužitelja, a potom je ručno razobličen. Zatim je označen prema prilagođenoj specifikaciji Praške ovisnosne banke stabala za označavanje na analitičkoj razini. Na kraju, označene su semantičke uloge prema specifikaciji za hrvatski jezik izrađenoj na Zavodu za lingvistiku.

Drugi se korpus, također označen na svim navedenim razinama, sastoji od oko 500 rečenica iz tečajeva za hrvatski jezik dostupnih na mrežnome portalu HR4EU, koji se izrađuje na Zavodu za lingvistiku na projektu financiranome od strane Europske unije u okviru Europskog socijalnog fonda.

Alati

SynSem vizualizator za prikaz sintaktičkih i semantičkih stabala izrađen je za potrebe pretrage Hrvatske ovisnosne banke stabala na dvjema razinama: sintaktičkoj i semantičkoj. Osim pretrage prema sintaktičkoj funkciji i semantičkoj ulozi, omogućena je pretraga prema obliku, lemi i morfosintaktičkoj oznaci.

SynSem vizualizator izrađen je u sklopu projekta HR.3.2.01-0037 "Mrežni portal za online učenje hrvatskoga jezika" (HR4EU), koji financira Europska unija kroz Europski socijalni fond (OP Razvoj ljudskih potencijala).

Ulaganje u budućnost

Specifikacije

Morfosintaktička specifikacija prema MulTextEast preporukama za hrvatski jezik dostupna je ovdje.

Sintaktička specifikacija dostupna je ovdje.

Specifikacija za označivanje semantičkih uloga dostupna je ovdje.

Ustanove

Zavod za lingvistiku
Filozofskoga fakulteta
Sveučilišta u Zagrebu
Ivana Lučića 3
10000 Zagreb
Croatia
tel. +385 1 6120-142, 6120-063
fax. +385 1 6156-879
e-pošta: zzl@ffzg.hr
web: http://www.ffzg.hr/zzl

Suradnici

Suradnici