Področja

 • leksikografija in leksikogramatika
 • korpusno jezikoslovje
 • računalniška obdelava naravnih jezikov
 • jezikovnotehnološka infrastruktura
 • računalniško podprto učenje in poučevanje jezikov

Večji zaključeni projekti

 • Sporazumevanje v slovenskem jeziku (2008-2013)

  Vloga: koordinator
  Financer: Evropski socialni sklad in Ministrstvo za izobraževanje, znanost in šport
  Opis: Spletni portali, baze podatkov, zbirke besedil ter jezikovne tehnologije in viri za sodobni slovenski jezik.

 • Korpus FidaPLUS (2003-2006)

  Vloga: koordinator
  Financer: Agencija za raziskovanje RS
  Opis: Korpus FidaPLUS je bil referenčna zbirka vsakdanje javne rabe slovenščine v pisnih besedil v obdobju med 1990 do 2006, ki je vseboval 621 milijonov besed. Naslednja generacija korpusa FidaPLUS je Gigafida.

 • Korpus FIDA (1997-2000)

  Vloga: koordinator
  Financer: založba DZS in podjetje Amebis
  Opis: Korpus FIDA je bil referenčna zbirka vsakdanje javne rabe slovenščine v pisnih besedil v obdobju med 1990 do 2000, ki je vseboval 100 milijonov besed. Naslednja generacija korpusa FIDA je bil korpus FidaPLUS.

 • Veliki angleško-slovenski slovar Oxford-DZS (1995-2006)

  Vloga: glavni urednik
  Financer: založba DZS d.d.
  Opis: Osnovni namen je bil s pomočjo besedilnih korpusov izdelati sodoben, široko uporaben, zanesljiv in uporabniško prijazen angleško-slovenski slovar, ki na eni strani beleži stanje sodobne angleščine in slovenščine, na drugi pa odseva aktualna sporazumevalna razmerja med jezikoma. V okviru tega projekta je bil razvit korpus FIDA.

Izbrani projekti v teku

 • ELEXIS (2018-2022)

  Vloga: koordinator
  Financer: Evropska komisija (Obzorje 2020)
  Opis: European Lexicographic Infrastructure, EU Research and Innovation action

 • Nova slovnica sodobne slovenščine (2017-2020)

  Vloga: vodja
  Financer: Agencija za raziskovanje RS
  Opis: Osnovni namen je raziskati jezikoslovne metodološke temelje celostne računalniške analize sodobne pisne in govorjene slovenščine, kakršna je zajeta v novih korpusih slovenskega jezika, ki bo zagotovila empirično osnovo za izdelavo novih empirično zasnovanih slovničnih opisov slovenskega jezika.

 • European Language Resources Coordination (2015-2019)

  Vloga: predstavnik za Slovenijo
  Financer: Evropska komisija, Connecting Europe Facility
  Opis: Mreža ELRC upravlja, vzdržuje in koordinira zbiranje jezikovnih virov za vse uradne jezike EU in pridružene članice CEF. Aktivnosti ELRC bodo prispevale k izboljšanju kvalitete, obsega in hitrosti strojnega prevajanja.