Področja

  • leksikografija in leksikogramatika
  • korpusno jezikoslovje
  • računalniška obdelava naravnih jezikov
  • jezikovnotehnološka infrastruktura
  • računalniško podprto učenje in poučevanje jezikov

Večji zaključeni projekti

  • Sporazumevanje v slovenskem jeziku (2008-2013)

    Vloga: koordinator
    Financer: Evropski socialni sklad in Ministrstvo za izobraževanje, znanost in šport
    Opis: Spletni portali, baze podatkov, zbirke besedil ter jezikovne tehnologije in viri za sodobni slovenski jezik.

  • Korpus FidaPLUS (2003-2006)

    Vloga: koordinator
    Financer: Agencija za raziskovanje RS
    Opis: Korpus FidaPLUS je bil referenčna zbirka vsakdanje javne rabe slovenščine v pisnih besedil v obdobju med 1990 do 2006, ki je vseboval 621 milijonov besed. Naslednja generacija korpusa FidaPLUS je Gigafida.

  • Korpus FIDA (1997-2000)

    Vloga: koordinator
    Financer: založba DZS in podjetje Amebis
    Opis: Korpus FIDA je bil referenčna zbirka vsakdanje javne rabe slovenščine v pisnih besedil v obdobju med 1990 do 2000, ki je vseboval 100 milijonov besed. Naslednja generacija korpusa FIDA je bil korpus FidaPLUS.

  • Veliki angleško-slovenski slovar Oxford-DZS (1995-2006)

    Vloga: glavni urednik
    Financer: založba DZS d.d.
    Opis: Osnovni namen je bil s pomočjo besedilnih korpusov izdelati sodoben, široko uporaben, zanesljiv in uporabniško prijazen angleško-slovenski slovar, ki na eni strani beleži stanje sodobne angleščine in slovenščine, na drugi pa odseva aktualna sporazumevalna razmerja med jezikoma. V okviru tega projekta je bil razvit korpus FIDA.

Izbrani projekti v teku

  • ELEXIS (2018-2021)

    Vloga: koordinator
    Financer: Evropska komisija (Obzorje 2020)
    Opis: European Lexicographic Infrastructure, EU Research and Innovation action

  • Nova slovnica sodobne slovenščine (2017-2021)

    Vloga: vodja
    Financer: Agencija za raziskovanje RS
    Opis: Osnovni namen je raziskati jezikoslovne metodološke temelje celostne računalniške analize sodobne pisne in govorjene slovenščine, kakršna je zajeta v novih korpusih slovenskega jezika, ki bo zagotovila empirično osnovo za izdelavo novih empirično zasnovanih slovničnih opisov slovenskega jezika.

  • European Language Resources Coordination (2015-2019)

    Vloga: predstavnik za Slovenijo
    Financer: Evropska komisija, Connecting Europe Facility
    Opis: Mreža ELRC upravlja, vzdržuje in koordinira zbiranje jezikovnih virov za vse uradne jezike EU in pridružene članice CEF. Aktivnosti ELRC bodo prispevale k izboljšanju kvalitete, obsega in hitrosti strojnega prevajanja.