Evropski projekti

  • European Lexicographic Infrastructure
    Vloga: koordinator
    Tip: Obzorje 2020 (RIA)
    Ustanova: Institut Jožef Stefan (AILAB)

  • European Language Equality
    Vloga: predstavnik nacionalnega kompetenčnega centra
    Tip: Obzorje 2020 (IA)
    Ustanova: Institut Jožef Stefan (AILAB)

  • Curated Multilingual Language Resources for CEF AT
    Vloga: raziskovalec, vodja projekta na IJS
    Tip: CEF (Telecom)
    Ustanova: Institut Jožef Stefan (AILAB)

  • Federated eTranslation TermBank Network
    Vloga: raziskovalec, vodja projekta na IJS
    Tip: CEF (Telecom)
    Ustanova: Institut Jožef Stefan (AILAB)

  • European Language Grid
    Vloga: predstavnik nacionalnega kompetenčnega centra
    Tip: Obzorje 2020 (IA)
    Ustanova: Institut Jožef Stefan (AILAB)

  • Multilingual Resources for CEF.AT in the legal domain
    Vloga: raziskovalec, vodja projekta na IJS
    Tip: CEF (Telecom)
    Ustanova: Institut Jožef Stefan (AILAB)

  • eTranslation TermBank
    Vloga: raziskovalec, vodja projekta na IJS
    Tip: CEF (Telecom)
    Ustanova: Institut Jožef Stefan (AILAB)

  • Cross-lingual Knowledge Extraction
    Vloga: raziskovalec
    Tip: FP7
    Ustanova: Institut Jožef Stefan

  • Technologies for the Multilingual European Information Society (T4ME)
    Vloga: raziskovalec
    Tip: FP7 (Network of Excellence)
    Ustanova: Institut Jožef Stefan

Projekti in programi ARRS

Vodja programa | centra


  • Tip: raziskovalni program
    Trajanje: 2019-2024
    Ustanova: Univerza v Ljubljani, Filozofska fakulteta
    Cilji programa: (1) razvoj korpusnojezikoslovnih metod za analizo sodobne slovenščine; (2) razvoj metod za računalniško-jezikoslovne raziskave večjezičnosti; (3) analize in razvoj metod za izboljšanje bralne pismenosti v digitalnem okolju; (4) razvoj naprednih tehnologij za analizo jezika; (5) publiciranje in promocija rezultatov programa v znanstveni in širši zainteresirani javnosti.

  • Tip: infrastrukturni center
    Trajanje: 2022-2027
    Ustanova: Univerza v Ljubljani, Fakulteta za računalništvo in informatiko
    Center za jezikovne vire in tehnologije Univerze v Ljubljani (CJVT UL) je enota Univerze v Ljubljani, namenjena znanstvenemu raziskovanju, vzpostavljanju in vzdrževanju temeljnih digitalnih jezikovnih virov in jezikovnotehnoloških orodij za sodobni slovenski jezik, ki so praktično uporabni in preko spleta dostopni vsem uporabnikom slovenskega jezika v svetu.

  • Tip: veliki raziskovalno-inovacijski sodelovalni program
    Trajanje: 2023-2026
    Cilj programa je razvoj velikih jezikovnih modelov, ki vplivajo na skoraj celotno področje umetne inteligence in strojnega učenja,  pomemben vpliv pa imajo tudi na številna druga področja in na celotno družbo. Novi prostodostopni in računsko učinkoviti jezikovni modeli bodo osnova za napredne aplikacije na področju medicine, humanistike, v industrijskem okolju in pri razvoju programske opreme. Prostodostopni veliki generativni jezikovni modeli in njihova prilagoditev za sledenje ukazom in dialoško komunikacijo bodo zagotovili tudi temeljno infrastrukturo za aplikacije umetne inteligence v slovenskem jeziku.

Vodja projekta


  • Tip: temeljni projekt
    Trajanje: 2017-2020
    V projektu želimo raziskati jezikoslovne metodološke temelje celostne računalniške analize sodobne pisne in govorjene slovenščine, kakršna je zajeta v novih korpusih slovenskega jezika, ki bo zagotovila empirično osnovo za izdelavo novih empirično zasnovanih slovničnih opisov slovenskega jezika.

  • Tip: bilateralni projekt
    Trajanje: 2016-2017
    Partner (Hrvaška): Institut za hrvatski jezik i jezikoslovlje
    Cilj projekta je bil oblikovati sistem za označevanje semantičnih vlog, ki bodo pripisane obstoječim skladenjskim odvisnostnim povezavam v učnih korpusih, ki so uporabljeni za algoritme strojnega učenja za oba jezika.

Vsi projekti ARRS

Podatki o raziskovalnih projektih, v katerih sem sodeloval, so našteti v informacijskem sistemu o raziskovalni dejavnosti v Sloveniji SICRIS.

  1. 2022-2023: J7-4642 Temeljne raziskave za razvoj govornih virov in tehnologij za slovenščino, dr. Darinka Verdonik
  2. 2022-2023: V5-2265 Proteverb – Pravni, etični in tehnološki vidiki obdelave besedilnih in govornih virov podatkov za znanstvene, raziskovalne in razvojne namene, dr. Aleš Završnik
  3. 2021-2023: J7-3159 Empirična podlaga za digitalno podprt razvoj pisne jezikovne zmožnostidr. Špela Arhar Holdt
  4. 2022-2023: V6-2276 Upravljanje jezikovne politike visokega šolstva: pregled stanja, dobrih praks in ukrepi, dr. Monika Kalin Golob
  5. 2017-2020: J6-8255 Kolokacije kot temelj jezikovnega opisa: semantični in časovni vidiki, dr. Iztok Kosem
  6. 2017-2020: J6-8256 Nova slovnica sodobne standardne slovenščine: viri in metode, dr. Simon Krek
  7. 2016-2018: L6-7134 Prepovedane knjige na Slovenskem v zgodnjem novem veku, dr. Luka Vidmar
  8. 2016-2018: J6-7094 Slovenska znanstvena besedila: viri in opis, dr. Tomaž Erjavec
  9. 2015-2018: V6-1509 Koncept madžarsko-slovenskega slovarja: od jezikovnega vira do uporabnika, dr. Iztok Kosem
  10. 2011-2013: L6-4193 Terminološke baze podatkov kot osnova strokovnih znanj: model za sistematizacijo terminologij, dr. Nataša Logar
  11. 2008-2009: L6-0163 Neznani rokopisi slovenskega slovstva 17. in 18. stoletja: informacijsko-tehnološko podprta evidenca, znanstvene objave in analize, dr. Matija Ogrin
  12. 2007-2009: J2-9180 Jezikoslovno označevanje slovenskega jezika: metode in viri, dr. Tomaž Erjavec
  13. 2007-2009: L6-9778 Slovenski terminološki portal, dr. Vojko Gorjanc
  14. 2008-2009: M2-0242 Razvoj sistema upravljanja z znanji v SV, dr. Jaroslav Berce
  15. 2008-2009: V2-0380 Elektronsko besedilno središče z multimedijsko komunikacijo, dr. Matija Ogrin
  16. 2005-2006: V6-0121 Oblikovanje slovenskega korpusnega omrežja, dr. Marko Stabej
  17. 2005-2006: V6-0122 Zasnova na korpusu temelječih slovarskih in slovničnih opisov slovenskega jezika, dr. Vojko Gorjanc
  18. 2005-2006: V5-0831 Standardizacija jezika Romov v Sloveniji in vključevanje romske kulture v vzgojo in izobraževanje, dr. Janez Krek

Drugi projekti

Vodja | koordinator

  • Naslov: Nadgradnja korpusov Gigafida, Kres, ccGigafida in ccKres
    Trajanje: 2015-2018
    Financer: Ministrstvo za kulturo
    Izvajalec: Center za jezikovne vire in tehnologije, Univerza v Ljubljani
    Vloga: vodja

  • Trajanje: 2008-2013
    Financer: Ministrstvo za izobraževanje, znanost in šport
    Vodilni partner: Amebis d.o.o., Kamnik
    Vloga: koordinator

Raziskovalec

  • Naslov: Za kakovost slovenskih učbenikov (KaUč)
    Termin izvajanja: 2017-2022
    Financer: Ministrstvo za izobraževanje, znanost in šport
    Vodilni partner: Univerza v Ljubljani (Pedagoška fakulteta)
    Vloga: raziskovalec (Institut “Jožef Stefan”)

  • Naslov: Jeziki Štejejo
    Termin izvajanja: 2017-2022
    Financer: Ministrstvo za izobraževanje, znanost in šport
    Vodilni partner: Univerza v Ljubljani (Pedagoška fakulteta)
    Vloga: raziskovalec

Projekti COST

  • Naslov: European Network for Combining Language Learning with Crowdsourcing Techniques
    Vloga: nadomestni član upravnega odbora iz Slovenije

  • Naslov: Evolution of reading in the age of digitisation
    Vloga: nadomestni član upravnega odbora iz Slovenije

  • Naslov: Evolution of reading in the age of digitisation
    Vloga: nadomestni član upravnega odbora iz Slovenije

  • Naslov: PARSing and Multi-word Expressions
    Vloga: član upravnega odbora iz Slovenije

  • Naslov: European Network of e-Lexicography
    Vloga: vodja delovne skupine “Inovativni e-slovarji”, član upravnega odbora iz Slovenije

Organizacija dogodkov

elex 2019

Dogodek: 5. mednarodna konferenca E-Lexicography in the 21st century: Smart lexicography, 1.-3. oktober 2019, Sintra, Portugalska
Vloga: član organizacijskega odbora

EURALEX 2018

Dogodek: 18. mednarodni kongres EURALEX, 17.-21. julij 2018, Ljubljana
Vloga: predsednik organizacijskega odbora

elex 2017

Dogodek: 5. mednarodna konferenca E-Lexicography in the 21st century: Lexicography from scratch, 19.-21. september 2017, Leiden, Nizozemska
Vloga: član organizacijskega odbora

LREC 2016

Dogodek: 10. mednarodna konferenca Language Resources and Evaluation Conference, 23.-28. maj 2016, Portorož, Slovenija
Vloga: član organizacijskega odbora

ENeL training school 2016

Dogodek: ENeL TRAINING SCHOOL, Tools and methods for creating innovative e-dictionaries, 17.-20. maj 2016, Ljubljana, Slovenija
Vloga: vodja organizacijskega odbora

ENeL/PARSEME workshop 2016

Dogodek: PARSEME/ENeL Workshop on MWE Lexicons, 4.-5. april 2016, Skopje, Makedonija (FYROM)
Vloga: vodja organizacijskega odbora

elex 2015

Dogodek: 4. mednarodna konferenca E-Lexicography in the 21st century: Linking lexical data in the digital age, 11.-13. avgust 2015, Herstmonceux , Velika Britanija
Vloga: član organizacijskega odbora

elex 2013

Dogodek: 3. mednarodna konferenca E-Lexicography in the 21st century: Thinking outside the paper, 17.-19. oktober 2013, Tallinn, Estonija
Vloga: član organizacijskega odbora

elex 2011

Dogodek: 2. mednarodna konferenca E-Lexicography in the 21st century: new applications for new users, 10.-12. november 2011, Bled, Slovenija
Vloga: sopredsednik organizacijskega odbora