Jezikovne in spletne tehnologije

Študij: Filozofska fakulteta

Stopnja: I bolonjska stopnja

Vrsta: Izbirni

Kreditne točke: 5 točk

Predavatelj: prof. dr. France Mihelič

Asistent: doc. dr. Vitomir Štruc


Obvestilo

Prvo predavanje (informativni sestanek) pri predmetu Jezikovne in spletne tehnologije bo v torek 10. oktobra 2017, s pričetkom ob 17:00, na Fakulteti za elektrotehniko, Tržaška cesta 25 v prostoru Laboratorij za umetno zaznavanje, sisteme in kibernetiko (LUKS učilnica) oznaka prostora AN204. Laboratorij se nahaja v drugem nadstropju glavne zgradbe (od vhoda na levo po stopnišču). Na sestanku bomo določili urnik izvajanj predavanj in vaj ter predstavili tematiko kakor tudi študijske obveznosti študentov pri predmetu.

Če se sestanka ne morete udeležiti, se lahko o poteku predavanj pozanimate tudi po elektronski pošti na naslov france.mihelic@fe.uni-lj.si, med govorilnimi urami (sreda 13:30 – 14:15, Fakulteta za elektrotehniko, kabinet BN207, II. nadstropje prizidek), ali po telefonu št. 01 4768 841.


Opis predmeta

Osnovni cilj predmeta je seznanitev z možnostmi, ki jih pri vsakdanjem delu z računalnikom humanističnemu uporabniku nudijo jezikovne in spletne tehnologije; ko računalnik ni samo malo boljši pisalni stroj ampak vsestranski in učinkovit osebni pomočnik. Cilj je študentu tudi skrajšati pot do aktivnega vstopa na svetovni splet.

Specifične kompetence, pridobljene s predmetom so: razumevanje osnov teorije informacij, vpogled v kvantitativni del informacijske vsebine sporočila, sposobnost ocene velikosti besednega zaklada besedila ter zmožnost njegove izdelave in uporabe, pregled nad prostodostopnimi jezikovnimi viri in orodji, razumevanje notranje strukture spletnih dokumentov, obvladanje osnov spletnega označevalnega jezika, zmožnost priprave dokumentov za objavo na svetovnem spletu na racionalen in učinkovit način, razumevanje poti pri prenosu elektronskih besedil med različnimi okolji in platformami.

Vsebina

Osnove teorije informacij. Entropija. Kvantitativni modeli jezika. Statistični opis besedila. Gradniki besedila kot elementi podatkovne zbirke in njihove porazdelitve. Pogostnostni slovar polnopomenskih besednih vrst izbranega besedila.

Leksikalne podatkovne zbirke. Označevanje besedila, razdvoumljanje naborov oblikoslovnih oznak,
lematizacija. Uporaba prostodostopnih jezikovnih virov ter orodij, spletni viri za strojno prevajanje.

Razvoj in pomen interneta svetovnega spleta. Označevalni jezik spletnih dokumentov. Prenos jezikovnih virov med različnimi platformami in relevantni standardi. Prostorsko učinkovito in človeško razumljivo (angl. human readable) kodiranje spletnih strani.

Literatura

  • V. Štruc: Jezikovne in spletne tehnologije: zbirka nalog (e-gradivo), 1. izdaja, Univerza v Ljubljani, 2014. [pdf]
  • D. Jurafsky, J. H. Martin, 2009. Speech and language processing, 2. izdaja, Prentice Hall, 1024 str.
  • V. Gorjanc, 2005. Uvod v korpusno jezikoslovje. Izolit, Domžale, 163 str.
  • C.F. Sabourin, Computational morphology – morphological analysis and generation. – Montreal, 1994.
  • M. Oakes, Statistics for Corpus Linguistics. – Edinburgh, 1997.
  • P. Jakopin, 2002. Entropija v slovenskih leposlovnih besedilih. Založba ZRC, Ljubljana, 208 str.