OCENE IN POROČILA. Vojko Gorjanc: Uvod v korpusno jezikoslovje. Domžale: Izolit, str.

Similar documents
KAKO GA TVORIMO? Tvorimo ga tako, da glagol postavimo v preteklik (past simple): 1. GLAGOL BITI - WAS / WERE TRDILNA OBLIKA:

Donosnost zavarovanj v omejeni izdaji

Površinskoskladenjsko označevanje korpusa Slovene Dependency Treebank

1. LETNIK 2. LETNIK 3. LETNIK 4. LETNIK Darinka Ambrož idr.: BRANJA 1 (nova ali stara izdaja)

METODE DRUŽBOSLOVNEGA RAZISKOVANJA (zimski semester, 2012/2013)

SEMANTIČNO OZNAČEVANJE KORPUSA SLOVENŠČINE PO MODELU FrameNet

Navodila za uporabo čitalnika Heron TM D130

Predstavitveni portal spletnih jezikovnih virov za slovenščino

Marko STABEJ, Helena DOBROVOLJC, Simon KREK, Polona GANTAR, Damjan POPIČ, Špela ARHAR HOLDT, Darja FIŠER, Marko ROBNIK ŠIKONJA

OCENJEVANJE SPLETNIH PREDSTAVITEV IZBRANIH UNIVERZ IN PISARN ZA MEDNARODNO SODELOVANJE

PRIKAZI, RECENZIJE. Andreja ŽELE Filozofska fakulteta, Univerza v Ljubljani

prelom /11/09 13:33 Page 1 OBDOBJA 28

Univerza na Primorskem/University of Primorska Fakulteta za humanistične študije/faculty of Humanities

(SLOVENSKA) LEKSIKA MED LEKSIKONOM IN SLOVNICO

GO. (Primer iz prakse) Vloga: BPM, CEO, CIO, BA

Slovenski jezik v visokem šolstvu, literaturi in kulturi

Družbeni mediji na spletu in kraja identitete

Slovenščina na spletu in v novih medijih

Kvalitativna raziskava med učitelji in ravnatelji

Rana ura, slovenskih fantov grob: analiza frazeoloških prenovitev v spletni slovenščini

SKUPINA ŽOGICE Starost: 4 6 let Vzgojiteljica : Jožica Kenig Pomočnica vzgojiteljice: Nataša Gabršček

Poslanstvo inštituta IRDO in Slovenske nagrade za družbeno odgovornost HORUS

Transfer znanja in socialni kapital v družbi znanja 1

POROČANJE O DRUŽBENI ODGOVORNOSTI V LETNIH POROČILIH PODJETIJ

40. Zbornik predavanj Moderno v slovenskem jeziku, literaturi in kulturi. seminar slovenskega jezika, literature in kulture

UNIVERZA V LJUBLJANI FAKULTETA ZA DRUŽBENE VEDE

PRESENT SIMPLE TENSE

Investiraj v znanje, investiraj v prihodnost!

Sistemi za podporo pri kliničnem odločanju

Prenova gospodarskih vidikov slovenskega zdravstva

ZNAČILNOSTI KITAJSKEGA POGAJALSKEGA SLOGA

Intranet kot orodje interne komunikacije

Izbrana poglavja iz sodobne teorije organizacije Klasična teorija organizacije

Milan Nedovič. Metodologija trženja mobilnih aplikacij

Z GEOMATIKO DO ATRAKTIVNEJŠEGA PODEŽELJA

ISLANDIJA Reykjavik. Reykjavik University 2015/2016. Sandra Zec

UČINKI VKLJUČEVANJA PODJETIJ V PANOŽNE KOMPETENČNE CENTRE

SIMPLE PAST TENSE (prosto prošlo vreme) Građenje prostog prošlog vremena zavisi od toga da li je glagol koji ga gradi pravilan ili nepravilan.

POGAJANJA V NABAVI V PODJETJU MERCATOR D.D.

KLJUČNI DEJAVNIKI USPEHA UVEDBE SISTEMA ERP V IZBRANEM PODJETJU

SLOVENSKA FILANTROPIJA. Izbrani prispevki. IV., V. in VI. Slovenskega kongresa prostovoljstva. (Novo mesto 2003, Sežana 2006, Bled 2008)

Barbara Ivančič Kutin

JE MAJHNA RAZLIKA LAHKO VELIK KORAK? ALI: KRITIČNI PREGLED PRENOVE CELOSTNE GRAFIČNE PODOBE ZAVAROVALNICE TRIGLAV

DIPLOMSKO DELO INTRANET SODOBNO ORODJE INTERNE KOMUNIKACIJE

UNIVERZA V LJUBLJANI FAKULTETA ZA DRUŽBENE VEDE

KOLEDAR STROKOVNIH SIMPOZIJEV V OBDOBJU APRIL JUNIJ 2008

Uporaba HTML 5 in CSS3 v spletnih kvizih

DIPLOMSKO DELO MOTIVACIJA ZAPOSLENIH V PODJETJU GOOGLE

UNIVERZA V LJUBLJANI VREDNOTENJE SPLETNIH PREDSTAVITEV NA TEMO VZAJEMNIH SKLADOV

53. seminar slovenskega jezika, literature in kulture

Glagolske večbesedne enote v učnem korpusu ssj500k 2.1

ODNOSI MED RAZLIČNIMI TIPI POLITIČNE KULTURE V SLOVENIJI

Kreativno okolje in uspe{nost mladih raziskovalcev

Ravnanje s človeškimi viri na primeru zdraviliškega

EU NIS direktiva. Uroš Majcen

Dostop do raziskovalnih podatkov v ADP in njihova analiza. Delavnica ADP, Ljubljana. Irena Vipavc Brvar ADP, Univerza v Ljubljani, 12.

Mladinsko delo in promocija zdravega življenjskega sloga

AMRES eduroam update, CAT alat za kreiranje instalera za korisničke uređaje. Marko Eremija Sastanak administratora, Beograd,

MODERNIZACIJA IN GLOBALIZACIJA**

Sistem kazalcev za spremljanje prostorskega razvoja v Evropski uniji in stanje v Sloveniji

FLUKTUACIJA KADRA V PODJETJU LESNINA d.d.

NAGRAJEVANJE ZAPOSLENIH KOT NAČIN MOTIVIRANJA V PODJETJU DIAMANT REWARDS OF EMPLOYEES AS A MOTIVATIONAL FACTOR IN COMPANY DIAMANT

Pridobivanje znanja v slovenskih malih in srednje velikih podjetjih

UNIVERZA V LJUBLJANI FAKULTETA ZA DRUŽBENE VEDE E-VOLITVE SLOVENIJA V PRIMERJALNI PERSPEKTIVI

UDEJANJANJE UČEČE SE ORGANIZACIJE: MODEL FUTURE-O

Zaradi flirtanja z zaposleno cenzurirali mojo glasbo! Stran

O izzivih lokalnih skupnosti med Ljubljano in Seulom

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA DIPLOMSKO DELO

ELEKTRONSKA DEMOKRACIJA V SLOVENSKIH OBČINAH

UNIVERZA V LJUBLJANI FAKULTETA ZA DRUŽBENE VEDE

PRENOVA PROCESA REALIZACIJE KUPČEVIH NAROČIL V PODJETJU STEKLARNA ROGAŠKA d.d.

PUBLI- KACIJE ZNANSTVENE ZALOŽBE FILOZOFSKE FAKULTETE

JEZIK IN SLOVSTVO. letnik LVII številka 3 4

UNIVERZA V LJUBLJANI FAKULTETA ZA DRUŽBENE VEDE

Monika Potokar Rant. Kiberseks: Primer Second Life. Diplomsko delo

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA DIPLOMSKO DELO KLEMEN ŠTER

Reprezentacija Romov na spletnih novičarskih portalih

Med produkcijo in prenosom znanja

Univerza v Lljubljani. Filozofska fakulteta. Oddelek za slovenistiko. Barbara Smisl SPOLSKO DOLOČENA RABA FRAZEMOV V REVIJALNEM TISKU.

Knjižne ocene in prikazil

VSAKDANJI PREDMETI. Nelektorirano delovno gradivo.

RAZVOJ KONCEPTA UČEČE SE ORGANIZACIJE V SLOVENIJI

SLOVENIA. committee members at the club.

Slovenski jezik Slovene Linguistic Studies

Priprava slikovnega gradiva in stavnice s programom SMART Notebook. Preparing Images and Beting with the Program SMART Notebook

Ogrodje mobilne aplikacije mfri

UPORABA IN STROŠKOVNA ANALIZA SISTEMA ZA UPRAVLJANJE SPLETNIH VSEBIN

Copyright po delih in v celoti FDV 2012, Ljubljana. Fotokopiranje in razmnoževanje po delih in v celoti je prepovedano. Vse pravice pridržane.

Navodila za uporabo tiskalnika Zebra S4M

ORGANIZACIJSKA KLIMA V BOHINJ PARK EKO HOTELU

PARTIZANSKA BOLNIŠNICA "FRANJA" (pri Cerknem) PARTISAN HOSPITAL "FRANJA" (near Cerkno)

RAZMISLEK O LUHMANNOVI SISTEMSKI TEORIJI V KONTEKSTU PROBLEMA DELOVANJA

Komunikacijske značilnosti prostora. mesto Ljubljana

VODENJE IN USPEŠNOST PODJETIJ

POVZETEK. Ključne besede: konflikt, reševanje konflikta, komunikacija

KONSTRUKTIVNI PRISTOP K NACRTOV ANJU OSEBNE KARIERE

INTERVJU Z REKTORJEM RAZVRŠČANJE UNIVERZ UNIVERZA ALABAMA ZDRAV DUH V ZDRAVEM TELESU. UMniverzUM ISSN Interna revija Univerze v Mariboru

SEZNAM UČBENIKOV, DELOVNIH ZVEZKOV IN UČNEGA GRADIVA ZA ŠOLSKO LETO 2016/17

OPREDELJEVANJE CILJNIH TRGOV ZA BODOČE ZDRAVILIŠČE RIMSKE TOPLICE

zbornik 2 Filozofske fakultete Univerze v Ljubljani

Transcription:

OCENE IN POROČILA Vojko Gorjanc: Uvod v korpusno jezikoslovje. Domžale: Izolit, 2005. 163 str. Z Uvodom v korpusno jezikoslovje smo Slovenci in predvsem slovenisti dobili prvo monografijo v slovenskem jeziku, ki za razliko od tujih podobnih del prikazuje korpusno jezikoslovje predvsem glede na stanje v slovenskem (korpusnem) jezikoslovju, čeprav seveda ne zanemarja tujih tokov in dogajanj na tem zadnje desetletje zelo produktivnem področju raziskovanja jezika. Delo tako že po sami idejni zasnovi zapolnjuje pomembno vrzel in se uvršča med osnovne pripomočke za vsakogar, ki v gradnji in/ali uporabi korpusov vidi potencial za svoje raziskovalno delo, pa seveda tudi za vsakogar, ki se želi s korpusnim jezikoslovjem samo seznaniti. Monografija Uvod v korpusno jezikoslovje avtorja Vojka Gorjanca je razdeljena v štiri večje razdelke, vsak od teh pa na več poglavij in podpoglavij. V uvodnem razdelku avtor predstavi tipologijo in karakteristike korpusov, na kratko oriše razvoj korpusov ter razpravlja o korpusih v razmerju do jezikoslovja. Drugi razdelek je namenjen gradnji korpusov. Po izhodiščnih premislekih avtor natančno razpravlja o načelih gradnje referenčnih korpusov ob primerih za večje angleške in ameriške korpuse ter srednjeevropske korpuse, seveda tudi ob obeh večjih slovenskih korpusih. Manj razpravljanja posveti označevanju korpusov, kjer predvsem predstavi vrste označevanja. Tretji razdelek je namenjen postopkom korpusne analize. Avtor ob primerih analize korpusa FIDA predstavi najpogostejše postopke analize, nazadnje pa še na kratko orodja za analizo. V zadnjem, četrtem razdelku nas avtor pripelje do srži korpusnega jezikoslovja: v njem navaja konkretne primere korpusne analize, rezultate analize pa nenehno sooča z obstoječimi jezikovnimi opisi v SSKJ in SP 2001. V prvem poglavju tako primerja listo besed v SSKJ in SP 2001 s pogostostno listo besed iz korpusa FIDA, drugo poglavje nameni vrednotenju nekaterih vidikov pravopisnega slovarja iz leta 2001 s stališča aktualnega zajetja slovenske družbene stvarnosti, v tretjem poglavju skuša s pomočjo korpusne analize slediti leksikalnim spremembam za primer poimenovanj s področja interneta, nazadnje pa prikaže primere, kako lahko zamejitev predmetnostnega področja (podkorpus) vpliva na rezultate korpusne analize. Na koncu monografije sledijo povzetek v slovenskem in angleškem jeziku ter angleško-slovenski in slovensko-angleški glosar s področja korpusnega jezikoslovja. Opremljenost s kazali je več kot zgledna, saj poleg standardnih vključuje med drugim izbor spletnih strani in seznam kratic. Delo Uvod v korpusno jezikoslovje se po svoji zasnovi dotika mnogih vprašanj, ki jih korpusno jezikoslovje odpira. V nadaljevanju osvetlimo le nekaj osrednjih vidikov korpusnega jezikoslovja in poglejmo, kako jih obravnava avtor monografije Vojko Gorjanc. Osrednje vprašanje je gotovo, kako se korpusno jezikoslovje umešča v študije o jeziku oz. jezikoslovje. Ali gre za novo metodologijo ali tudi ločeno raziskovalno izhodišče in kakšno? Tega vprašanja se avtor na kratko dotakne v uvodu, kjer ugotavlja: Korpusni pristop danes v jezikoslovju pogosto velja za komplementarnega Jezik in slovstvo, let. 51 (2006), št. 3 4

142 Ocene in poročila tradicionalnim, vendar vsaj v nekaterih segmentih jezikoslovja, predvsem v leksikologiji in leksikografiji, vse bolj pa tudi pri drugih jezikovnih opisih pomeni bistveno spremembo metodologije raziskovanja in tako oblikuje samostojno raziskovalno izhodišče. (7.) Širše razpravljanje na temo položaja korpusnega jezikoslovja znotraj raziskovanja jezika je v četrtem poglavju prvega razdelka, kjer avtor razpravlja o korpusih in jezikoslovju. Opozori na diskusije med predstavniki tvorbno-pretvorbene slovnice in zagovorniki raziskovanja na podlagi obsežnega, načrtno zbranega gradiva. Ugotavlja, da korpusno jezikoslovje pomeni zbirni pojem za niz različnih aktivnosti v zvezi s korpusi, znotraj jezikoslovja pa se vse bolj uveljavlja poimenovanje korpusni pristop. Ta je lahko delni ali popolni. Samo popolni korpusni pristop pomeni uporabo korpusa neodvisno od uveljavljenih jezikoslovnih interpretacij, sicer so analize obremenjene z obstoječimi jezikoslovnimi koncepti. Korpus je tako pogosto le vir za preverjanje hipotez, samo pri popolnem korpusnem pristopu, kjer so predmet analize le»surova«besedila brez kakršnih koli jezikoslovnih oznak, je korpus tudi vir za gradnjo hipotez. Avtor ugotavlja, da se jedro korpusnega jezikoslovja oblikuje ob raziskavah, kjer je korpus vir za gradnjo hipotez. Čeprav so korpus in potrebna orodja za analizo samo priprave za jezikoslovno (ali jezikovnotehnološko) raziskovanje, so zahtevni tako časovno in finančno kot tudi glede znanj, potrebnih za to delo. Korpusno jezikoslovje tako nikakor ni samo ali predvsem korpusna analiza, pač pa je veliko pozornosti treba posvetiti tudi gradnji korpusov in razvoju orodij za delo s korpusom. Monografija Uvod v korpusno jezikoslovje zajame vsa osrednja področja korpusnega jezikoslovja: predstavi obstoječe korpuse, opozori na dilemo vključevanja različnih vrst besedil v referenčne korpuse, navaja vrste jezikoslovnega označevanja korpusov, nas seznani s postopki korpusne analize, na kratko opiše najbolj znana orodja za analizo in navaja primere korpusne analize. Pri tem ostaja predvsem na»jezikoslovnem«bregu korpusnega jezikoslovja: možnost uporabe korpusov za razvoj jezikovnotehnoloških aplikacij je zgolj omenjena (23). Nekoliko morda pogrešamo tudi kakšno napotilo bralcu, da korpusna analiza ponuja še številne druge možnosti raziskovanja, če se naučimo sami programirati preproste iskalne algoritme (nekaj primerov takšnih analiz s kratkimi opisi najdemo npr. v delu Biberja idr. 1998). Pri navajanju postopkov korpusne analize in primerov je monografija Uvod v korpusno jezikoslovje osredotočena predvsem na uporabo korpusne analize v leksematiki in leksikalnem pomenoslovju. To je nedvomno utemeljeno s tem, da se osrednji prispevek korpusnega jezikoslovja kaže prav v slovaropisju in razvoj referenčnega korpusa slovenskega jezika FIDA je tesno povezan s slovaropisjem kot vir služi pri gradnji Velikega angleško-slovenskega slovarja (Krek idr. 2005 ), pa tudi v bolj individualnih projektih, pomembnejši med temi je poskusni zvezek besednodružinskega slovarja slovenskega jezika (Stramljič Breznik 2004). Že sam avtor pa ob tem opozarja, da se korpusi v jezikoslovju uporabljajo za vrsto raziskav, od fonetično-fonoloških do sociolingvističnih. Na ta vidik nikakor ne smemo pozabiti. Tuji avtorji, npr. Kennedy idr. 1998, tako med jezikoslovnimi opisi angleščine, ki temeljijo na korpusu, poleg besedoslovnih opisov navaja oblikoslovne, skladenjske, pragmatične in besedilnovrstne študije, Biber idr. 1998 pa poleg tega opozarjajo še na uporabnost korpusov pri učenju jezikov in razvoju jezikovnih zmožnosti, jezikovnozgodovinskih in stilističnih študijah ipd. Tudi v slovenskem prostoru najdemo nekaj na korpusu temelječih študij, npr. Modrijan 2004 uporabi korpusni pristop za analizo naslavljanj, Gantar 2005 s korpusnim pristopom analizira mesto stalnih besednih zvez v slovenskem leksikalnem fondu, vendar lahko te štejemo bolj za začetke. Delo Uvod v korpusno jezikoslovje je za nadaljnji razvoj takšnih

Ocene in poročila 143 študij nedvomno vzpodbudno in aktualno za kar najširši krog raziskovalcev jezika. Pa ne samo za raziskovalce: vsak zaveden pišoči posameznik, ki pozna pomen slovarja, bo podobno uporabnost našel tudi v korpusu, Uvod v korpusno jezikoslovje pa mu bo dragocen vodnik pri uporabi korpusov. Avtor v uvodu poudarja, da korpusni pristop v analizo jezika vnaša večjo verodostojnost, saj omogoča izpostavitev v jeziku tipičnega in zmanjšuje možnost obrobnega kot temeljnega. Seveda pa tudi za korpusni pristop velja, da je treba glede na postopke analize rezultate kritično vrednotiti, kot opozarja tudi avtor (npr. stran 72). Še bolj pa je treba kritično vrednotenje ohraniti do gradiva oz. do tako imenovane reprezentativnosti korpusa. Avtor se tega problema natančno zaveda in mu posveti veliko pozornosti:»eno temeljnih vprašanj korpusnega jezikoslovja je zagotavljanje reprezentativnosti korpusa: kako določiti in uravnotežiti količino raznoterih besedil v korpusu.«(30.) Naj sklenemo: delo Uvod v korpusno jezikoslovje prinaša dober pregled področja. Po zasnovi je namenjeno predvsem jezikoslovni publiki, po načinu obravnave problema pa lahko dostopno bralcem, ki se s korpusnim jezikoslovjem šele želijo seznaniti, kot tudi zahtevnejšim bralcem, ki najdejo v njem na enem mestu zbrane informacije in podatke o tem področju. Darinka Verdonik Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko darinka.verdonik@uni-mb.si Uporabljena literatura Biber, D., Conrad, S. in Reppen, R., 1998: Corpus Linguistics: Investigating Language Structure and Use. Cambridge University Press. Gantar, Polona, 2005: Mesto stalnih besednih zvez v (sodobnem) slovenskem leksikalnem fondu: korpusni pristop. Erika Kržišnik, (ur.): Frazeologija v jezikoslovju in drugih vedah. Ljubljana: Filozofska fakulteta. Kennedy, Graeme, 1998: An Introduction to Corpus Linguistics. London New York: Logman. Krek, S., Gabrovšek, D., Stabej, M., Prosenc Šegula, I., Smolej, M., Komar, S. in Vesel, N. (ur.), 2005 : Veliki angleško-slovenski slovar Oxford. Ljubljana: DZS. Modrijan, Nina, 2004: Korpusni pristop pri analizi naslavljanja. Tomaž Erjavec in Jerneja Žganec Gros (ur.): Jezikovne tehnologije. Ljubljana: Institut Jožef Stefan. Stramljič Breznik, Irena, 2004: Besednodružinski slovar slovenskega jezika: Poskusni zvezek za iztočnice na B. Maribor: Slavistično društvo Maribor.

144 Ocene in poročila LREC 06 Language Resources and Evaluation Conference 2006, Genova, 24. 26. maj 2006»LREC'06 je srečanje vseh, ki verjamejo, da so jezikovni viri in njihovo vrednotenje temeljni kamen jezikovnih tehnologij, tako za pisni kot govorjeni jezik. Če želiš srečati koga s tega področja, pojdi na LREC in on/ona bo tam!«ta figurativna ocena organizatorjev konference, ELRE/ELDE, 1 niti ni veliko pretirana če sodimo po več kot 800 udeležencih in okoli 500 sprejetih prispevkih, kar se jih je zvrstilo samo v rednem programu konference (tj. brez spremljajočih delavnic), gre resnično za eno osrednjih znanstvenih srečanj na področju jezikovnih virov. Termin jezikovni viri zajema tako rekoč vsako urejeno elektronsko zbirko, ki jo lahko uporabimo kot vir informacij o jeziku, pa naj bodo to slovarji (s pomenskimi opisi, z oblikoslovnimi oznakami, fonetičnimi prepisi, dvo- ali večjezični slovarji itd.), korpusi (pisnih ali govorjenih besedil, referenčni ali specializirani, enojezični ali dvojezični (poravnani), z vključenimi oblikoslovnimi oznakami, fonetičnim prepisom, oznakami o skladenjskih ali semantičnih razmerjih, pragmatičnih elementih itd.), posnetki govora s pripadajočimi transkripcijami (fonetičnimi in/ali ortografskimi, oznakami šumov, podatki o govorcih, kanalu itd.)... Sem štejemo tudi osnovna programska orodja za zbiranje, urejanje in uporabo teh zbirk. Na LREC-u se vsaki dve leti srečujejo strokovnjaki, ki izvirajo iz tehniških ved ali jezikoslovja, iz akademskega okolja ali gospodarstva. Jezikovni viri so podpora za razvoj različnih komponent, sistemov oz. aplikacij, ki so del razvoja t. i. e-družbe (npr. različne jezikovne storitve, e-vlada, e-oglaševanje, e-učenje...), vendar se tukaj omejimo predvsem na njihovo uporabo v jezikoslovju. V slovenskem okolju se korpusni pristop k raziskovanju jezika šele začenja razvijati, kar je omogočil zlasti referenčni korpus FIDA; zavedanje, da je lahko vpogled v vrste jezikovnih virov in pristope k raziskovanju, ki jih sodobne tehnologije omogočajo, koristen vir novih idej ali izzivov za delo jezikoslovcem z najrazličnejših področij, pa naj se ukvarjajo z glasoslovjem, skladnjo, besedotvorjem, dialektologijo, semantiko, pragmatiko, slovaropisjem, prevajanjem..., se tako v slovenski jezikoslovni javnosti šele počasi širi. Množičnejši razvoj jezikovnih virov se v svetu začne v začetku devetdesetih let dvajsetega stoletja in po mnenju Nicolette Calzolari, vodje konference LREC'06, so bila takrat osrednja vprašanja razvoja standardizacija jezikovnih virov, gradnja temeljnih jezikovnih virov in označevanje ter distribucija jezikovnih virov. Danes se kaže tudi četrto vprašanje, ki se nanaša na metode avtomatskega pridobivanja jezikoslovnih (in drugih) informacij. Če gledamo označevanje jezikovnih virov z vidika tradicionalnega jezikoslovja, se zdi oblikoslovno označevanje (kot je npr. vključeno tudi v slovenski referenčni korpus FIDA) bolj ali manj rešeno vprašanje. Tudi skladenjsko označevanje (ki pa je za slovenščino šele v začetku) je doseglo zadovoljive rezultate. Kar se na podlagi prispevkov na konferenci LREC'06 kaže kot ospredje zanimanja jezikovnih virov danes, je po mnenju Nicolette Calzolari semantika, ki je osrednja tema tako razvoja slovarjev kot korpusov. To potrjujejo številne sekcije, ki vključujejo to temo, kot na primer Ontologije, Občutja in semantika, Vrednotenje semantike in pomenov, Semantično označeni korpusi, Sintaktični in semantični slovarji, Semantika, ontologije, semantične mreže itd. 1 ELRA (European Language Resources Association) je nepridobitna organizacija, ki skrbi za distribucijo jezikovnih virov. Več informacij o njej najdemo na http://www.elra.info. ELDA (Evaluations and Language Resources Distribution Agency) je operativno telo ELRE, ki beleži, klasificira, zbira, vrednoti in tudi gradi jezikovne vire. Naslov spletnih strani je http://www.elda.org/site2006.

Ocene in poročila 145 Nove zanimive teme na področju jezikovnih virov so povezane z iskanjem, označevanjem in analizo subjektivnih elementov, tako v govorjenih kot pisnih besedilih. Gre predvsem za elemente, ki izražajo osebna mnenja, ali elemente, ki izražajo občutja. Pri slednjih nekateri vodilni avtorji s tega področja opozarjajo na terminološko razliko med emocijami (angl. emotion), ki so sicer predvsem z akustičnega vidika že dalj časa predmet zanimanja govornih tehnologij, zlasti sinteze govora, in občutji (angl. affect) v luči procesiranja govora. Že nekaj časa sta vroči temi tudi večjezikovnost, torej gradnja vzporednih korpusov in dvo- ali večjezičnih slovarjev ter orodij in algoritmov zanje, ter večmodalnost (večmodalna orodja, večmodalni korpusi...). Precej prispevkov na konferenci se ukvarja z vrednotenjem jezikovnih virov in z razvojem orodij in metodologij za vrednotenje ter z infrastrukturo in arhitekturo jezikovnih virov. Svoj delež ohranjajo prispevki, ki se nanašajo na govor. Gradnja govornih korpusov različnega obsega in v različne namene je ta čas aktualna npr. za ruščino, portugalščino, nizozemščino, japonščino, italijanščino, danščino... Seveda je govor obvezna tema v povezavi s sintezo in razpoznavo govora, prevajanjem govora in sistemi dialoga. Čeprav je konferenca posvečena jezikovnim virom, nekaj pozornosti pritegnejo tudi sistemi, predvsem sistemi strojnega prevajanja, pridobivanja in luščenja informacij in dialoga odgovarjanja na vprašanja. Vseeno so kolegi s področja tehniških ved, s katerimi smo bili na konferenci, ugotavljali, da se jezikoslovni del publike na LREC-u v primerjavi s prejšnjimi leti krepi. Na konferenci LREC je bilo zastopanih okoli petdeset različnih jezikov, večina evropskih, pa seveda azijskih, bližnjevzhodnih, afriških... Slovenščino že vrsto let s po več prispevki zastopajo predvsem avtorji iz jezikovnotehnoloških centrov v Sloveniji, npr. z Instituta Jožef Stefan, Fakultete za elektrotehniko v Ljubljani, Fakultete za elektrotehniko, računalništvo in informatiko v Mariboru idr., redkeje pa se pojavlja kot obravnavani jezik tudi v predstavitvah tujih avtorjev, predvsem po zaslugi mednarodnih projektov, v katere se vključujejo naše institucije. Letos smo avtorji prispevkov o jezikovnih virih za slovenščino predstavljali vzporedni korpus, skladenjsko označeni korpus, en prispevek sega na področje semantike, dva pa na področje govornih korpusov. Tomaž Erjavec je predstavljal angleškoslovenski vzporedni korpus ACQUIS. Korpus vsebuje približno 10 milijonov besed, ki tvorijo angleško-slovenski pomnilnik prevodov SVEZ ACQUIS. Ta pomnilnik prevodov je bil izdelan med procesom prevajanja zakonodaje EU (ACQUIS) v slovenski jezik, v okviru prevajalske skupine SVEZ. Angleški in slovenski tekst je označen na ravni besed, lematiziran in oblikoslovno označen, vendar vse samo z avtomatskimi postopki. V raziskovalne namene je dostopen prek spletnih strani http://nl.ijs.si/svez, kjer je tudi več podatkov o njem. Skupaj z Darjo Fišer je Tomaž Erjavec predstavljal gradnjo besedne mreže WordNet za slovenski jezik. Besedna mreža je elektronska besedna zbirka, v kateri so samostalniki, glagoli, pridevniki in prislovi povezani z leksikalnimi in semantičnimi relacijami. Te vrste semantični leksikoni so pomemben vir npr. za razvoj semantičnega označevanja, avtomatskega povzemanja, avtomatskega pridobivanja podatkov ipd. WordNet za slovenski jezik vsebuje trenutno okoli 5000 konceptov, ki so bili avtomatsko prevedeni iz srbskega WordNeta s pomočjo dvojezičnega slovarja in ob podpori pojavnosti v korpusu, rezultati pa so bili ročno popravljeni. S. Džeroski, T. Erjavec, N. Ledinek, P. Pajas, Z. Žabokrtsky in A. Žele so predstavljali začetke gradnje skladenjsko označenega korpusa (t. i. treebank) za slovenski jezik. Gre za del vzporednega korpusa MULTEXT-East, natančneje prvi del Orwellovega romana 1984. Pri tem so se naslonili na češki Prague Dependency Treebank, ki ima med podobnimi korpusi kar dolgo tradicijo. Izbira je smiselna predvsem zaradi podobnosti jezikov. Slovenski skladenjsko označeni korpus obsega trenutno 2000 povedi oz.

146 Ocene in poročila 30.000 besed. J. Gros, V. Cvetko Orešnik, P. Jakopin in A. Mihelič so predstavljali fonetični leksikon za slovenski jezik SI- PRON. Leksikon vključuje fonetične prepise za slovenske besede, ki so zbrane v SSKJ, razširjen s številnimi pregibnimi oblikami. Po obsegu je verjetno največji tovrstni leksikon za slovenski jezik, vsebuje 1,4 milijona vnosov. A. Žgank, D. Verdonik, A. Zoegling Markuš in Z. Kačič smo predstavljali bazo SINOD, ki vsebuje posnetke in transkripcije govora govorcev slovenščine, ki jim slovenščina ni materni jezik. Gre za dodatek k bazi BNSI Broadcast News, ki obsega 72 ur govora v televizijskih informativnih oddajah in okroglih mizah, transkribiranega in označenega v skladu z mednarodnimi standardi gradnje baz tipa Broadcast News. SINOD vsebuje posnetke v skupni dolžini 102 minuti. Avtorica tega poročila sem predstavljala korpus telefonskih pogovorov v turizmu TURDIS. Korpus vključuje transkripcije približno 4,5 ure telefonskih pogovorov (43.000 besed) s turistično agencijo, turistično pisarno in hotelsko recepcijo. V konferenčnem zborniku z več kot 500 prispevki je seveda težko imeti pregled nad vsebino. Pri tem sta v veliko pomoč posebna knjiga povzetkov in razvrstitev člankov po sekcijah, kot so bili predstavljeni na konferenci. Sicer je res, da te razporeditve niso vedno povsem posrečene, kar pa ob toliko prispevkih organizatorjem lahko oprostimo. Zbornik izhaja tako v papirni kot elektronski obliki, verjetno pa bo počasi prevladala elektronska, saj je bilo treba letos tiskane izvode posebej naročiti. Pomemben razlog je najbrž prav obseg, ki je samo od leta 2002 do 2004 narasel s treh na šest knjig, ob toliko dodatne prtljage in prostora na knjižni polici pa človek dvakrat premisli. Elektronska verzija je tudi opremljena z avtomatskimi iskalniki po avtorjih, naslovih in ključnih besedah, kar močno pohitri dostop do iskanih vsebin. Naslednja konferenca LREC bo leta 2008. Po napovedih se bo prvič iz evropskih držav (do zdaj je dvakrat gostovala v Španiji, po enkrat pa v Grčiji, Portugalski in Italiji) selila na afriško celino, v Marakeš v Maroku. Darinka Verdonik Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko darinka.verdonik@uni-mb.si Jezik i identiteti 20. znanstveno srečanje z mednarodno udeležbo v organizaciji Hrvaškega društva za uporabno jezikoslovje, Split, 25. 27. maj 2006 Že tretje leto je Hrvaško društvo za uporabno jezikoslovje (HDPL, http://www.hdpl.hr) v sodelovanju s Hrvaško akademijo znanosti in umetnosti in njenim splitskim Zavodom za znanstveno in umetniško delo priredilo svoje letno znanstveno srečanje v Splitu. Jubilejno 20. srečanje je imelo naslov Jezik in identitete. Po podatkih organizatorjev se je srečanja udeležilo skoraj 200 udeležencev iz 12 držav; med njimi so bili kot ponavadi kar precej množično zastopani tudi slovenski predstavniki. Bogat program nekaj čez sto predavanj in referatov, ki je potekal tri polne dni večinoma v dveh paralelnih sekcijah, sta dopolnjevali tudi predstavitev knjig (med njimi npr. obsežnega zbornika lanskega srečanja z naslovom Jezik & mediji, jedan jezik, više svjet@, ur. Jagoda Granić in Uvoda v korpusno jezikoslovje Vojka Gorjanca) in gledališka predstava Billie Halliday v HNK Split. Split sam je že kot mesto odlična prispodoba za sestavljenost identitete in identitetno

Ocene in poročila 147 raznolikost; živa urbana tvorba z zelo dolgo kontinuiteto nakazuje po eni strani krhkost posameznega človekovega bivanja, po drugi strani pa priča o strašni želji in moči človeškega preživetja. Glede na nedavno vojno zgodovino in verjetno evropsko prihodnost države Hrvaške so seveda vprašanja identitete v sosednji državi zelo aktualna v vseh smislih najbrž pa tudi sicer na svetu ni okolja, kjer se ne bi vedno znova postavljala vsaj nekatera tovrstna vprašanja. Južnoslovanski prostor je jezikovno, kulturno in identitetno še vedno močno tranzicijski (kar pravzaprav ne pomeni nič drugega kot to, da je še spremenljivejši od drugih prostorov), hkrati pa tudi posttravmatičen in kot tak zelo potreben odprte in poglobljene razprave. Sestavljenost identitete je izpostavil že prvi predavatelj, Ivo Pranjković, v preglednem prispevku o zgodovinskih in sodobnih vprašanjih hrvaške jezikovne identitete; morda najambicioznejši model identitete v soodvisnosti z identičnostjo in različnostjo je zadnji dan predstavil v plenarnem predavanju Branko Tošović; precej duhovitih prispodob in zanimivih anekdotičnih primerov pa sta ponudila oba povabljena predavatelja, Michael Byram z Univerze v Durhamu, s politično korektnim evropsko obarvanim modelom večjezičnega in večkulturnega izobraževanja, in Ricardo Maldonado z Mehiške državne avtonomne univerze (Universidad Nacional Autónoma de México) z analizo mnenj evropskih govorcev španščine o španskih govorcih iz Latinske Amerike, podprto s kognitivno teorijo mentalnih prostorov. Slovenski prispevki so bili precej raznoliki; v plenarnih sekcijah so nastopili Vojko Gorjanc z referatom Identiteta: kreiranje v diskurzu in konstruiranje v slovarju (naslove slovenimo, op. ur.), Neva Čebron z referatom Odkrivanje lastne identitete z interkulturnim poučevanjem, Dunja Jutronjić s prispevkom Splitski čakavski leksikon deset let kasneje, Vesna Požgaj Hadži pa je bila soavtorica referata Jezikovna identiteta in spol, ki ga je predstavil drugi soavtor, Damir Horga. V paralelnih sekcijah so nastopili Vesna Mikolič (Struktura medetnične ozaveščenosti v večkulturnem okolju), Nada Šabec (Vloga jezika v etnični identifikaciji ameriških Slovencev), Antun Pavlin (Viški dialekt in identiteta, v soavtorstvu z Antonom Vukelićem), Ženja Kansky Rožman (Vloga metafore v poslovnem diskurzu), Nives Lenassi (Nekaj lastnosti slovenskih in italijanskih e-mailov v poslovni komunikaciji), Marko Stabej (Slovnica, ideologija, identiteta), Katarina Dea Žetko (Samostalnik kot levi prilastek samostalniške besedne zveze v slovenskem jeziku) ter Simona Bergoč (»Zamišljanje«slovenščine kot nacionalnega jezika). V obeh dvoranah prelepe zgodnjebaročne palače Milesi smo lahko poskušali referate z zelo različnih področij, od socio- do psiho- in kognitivnolingvističnih. Tudi teme so bile različne, veliko je tekla beseda o večkulturnosti in globalizaciji, seveda v povezavi z jezikovnimi vprašanji, precej referentov je obravnavalo jezikovni položaj različnih manjšinskih skupnosti, precej pozornosti pa je bilo posvečene tudi vprašanjem jezikovnega vidika nacionalnih, regionalnih, socialnih, spolnih, političnih ter drugih identitet. Sorazmerno malo je bilo specializiranih uporabnojezikoslovnih tematik (npr. jezik slepih), vendar je to glede na letošnjo krovno temo najbrž razumljivo. Zdi pa se, da se uporabno jezikoslovje vsaj v kontekstu splitske konference po eni strani pogumno loteva novih tem (kar je gotovo dobro), po drugi strani pa se v veliki meri odreka nekdanjim strogim metodološkim zahtevam (kar je v marsičem slabo). Metodološka in teoretična raznolikost je seveda pri takem dogodku dobrodošla in samoumevna. Kljub temu pa se zdi, da je težava kongresov HDPL vidna in izrazita neuravnoteženost kvalitete referatov. Tak razpon prispevkov od nacionalističnih purističnih jezikovnih agitacij do teoretično, metodološko in izvedbeno odličnih nastopov je pri znanstvenih konferencah precej nenavaden. Pri kasnejši objavi se sicer to z recenzentskim in uredniškim postopkom bistveno izboljša, toda pri spremljanju konference lahko postane zelo moteče.

148 Ocene in poročila Še dve slabosti sicer odlično organizirane konference je na zaključku ko se je v imenu udeleženk in udeležencev s šopkom zahvalil glavni organizatorici in predsednici društva Jagodi Granić previdno omenil znameniti hrvaški jezikoslovec Damir Kalogjera: velika časovna nedisciplina pretežnega dela nastopajočih in hudo pomanjkanje časa za diskusijo. Pri tolikšnem številu nastopajočih in samo največ dveh vzporednih sekcijah bo drugo slabost težko preseči glede prve pa bi se gotovo dalo pomagati že zdaj. Čeprav drži, da agresivnejše predsedovanje sekcijam nekako ne sodi v prijazno splitsko okolje, brez tega vendarle ne bo šlo, saj na samodisciplino predavateljev po izkušnjah sodeč nikakor ne kaže računati. Kljub izrečenim kritičnim besedam je srečanje hrvaškega društva za uporabno jezikoslovje nedvomno dobrodošla in dragocena priložnost za izmenjavo védenja in mnenj med tistimi jezikoslovci in jezikoslovkami, ki jezik poudarjeno raziskujejo v družbenem, psihološkem in besedilnem kontekstu. Množična slovenska udeležba pomeni željo po predstavitvi in sodelovanju slovenskega jezikoslovja v širšem južnoslovanskem prostoru, po drugi strani pa vsaj malo razkriva tudi pereče pomanjkanje dejavnosti slovenskega društva za uporabno jezikoslovje. V devetdesetih letih je prirejalo kakovostne in odmevne bienalne kongrese, trenutno pa miruje. Lahko kako pomagamo? Marko Stabej Univerza v Ljubljani, Filozofska fakulteta marko.stabej@ff.uni-lj.si LEXICOM Europe 2006 Annual Workshop in Lexicography and Lexical Computing, Opatija, 4. 9. junij 2006 Letos se je v Opatiji odvijala že šesta leksikografska delavnica LEXICOM, ki jo od leta 2001 na različnih krajih po Evropi in v sodelovanju z različnimi (akademskimi) institucijami prireja angleško podjetje Lexicography MasterClass Ltd. Letošnji gostitelji, Pomorski fakultet, Sveučilište u Rijeci, so za en delovni teden v mediteransko letovišče privabili približno trideset udeležencev iz desetih evropskih držav, Združenih držav Amerike in Arube. Poleg številčne hrvaške zasedbe je po številu, a tudi delavni vnemi izstopala slovenska sedemčlanska delegacija iz univerzitetnega in založniškega sveta, ki je svoje bivanje v primorju izkoristila tudi za spoznavanje kolegov iz tujine in domovine. Vreme jim je bilo pri tem le v pomoč, saj so Angleži poleg znanja s seboj prinesli hladne in deževne dni, ki so bili kot nalašč za intenzivno delo in živahne debate ob kavi. Lexicography MasterClass Ltd je podjetje, ki v različnih oblikah ponuja svoje leksikografsko in z leksikografijo povezano računalniško znanje. Poleg raznovrstnih izobraževanj, namenjenih široki paleti strokovnih profilov (študentom, leksikografom, prevajalcem, jezikovnim tehnologom, urednikom...), se ukvarja tudi s svetovanjem in sodelovanjem pri korpusnih projektih, vprašanjih rabe obstoječih ali izdelave novih računalniških leksikografskih orodij ter pri načrtovanju in izpeljavi konkretnih slovarskih projektov. Ker pa so podjetje pravzaprav ljudje, še nekaj besed o njih: Sue Atkins, Michael Rundell in Adam Kilgarriff so vrhunski evropski strokovnjaki s področja teoretične in praktične, tako dvojezične kot enojezične leksikografije ter računalniškega jezikoslovja, ki so sooblikovali že mnogo (velikih) slovarskih in jezikovnotehnoloških projektov, na primer Collins-Robert English-French Dictionary,

Ocene in poročila 149 Oxford-Hachette English-French Dictionary, Macmillan English Dictionary for Advanced Learners, FrameNet, BNC ter Word Sketch Engine in BootCat, če jih naštejeva res le nekaj, eden najnovejših velikih projektov podjetja pa je bila zasnova novega angleškoirskega slovarja, ki je vključevala tudi jezikovnotehnološko podporo, med drugim izdelavo 30-milijonskega korpusa irščine in 25-milijonskega korpusa irske angleščine (več o projektu na http://www.focloir.ie, več o podjetju pa na http://www.lexmasterclass. com). LEXICOM je intenzivno petdnevno izobraževanje, ki združuje kratka, zgoščena predavanja o teoretičnih izhodiščih leksikografije, računalniške leksikografije in korpusnega jezikoslovja ter samostojno ali skupinsko praktično delo, deloma organizirano v paralelnih sekcijah, slovaropisni in jezikovnotehnološki. Predavatelji so živahno, zanimivo in s precejšnjo mero humorja posredovali vsebine, povezane z zasnovo in izdelavo korpusnih slovarjev ter gradnjo in učinkovito izrabo spletnih korpusov v leksikografiji. Atkins in Rundell sta udeležence seznanila predvsem z osnovnimi in bistvenimi leksikografskimi problemi in možnimi rešitvami, ki segajo od zasnove slovarja do izdelave konkretnih geselskih člankov. Pri zasnovi slovarja je bila posebej izpostavljena pomembnost oblikovanja natančnih navodil za leksikografe, usklajenih z uredniško politiko, ta pa mora med drugim temeljiti na upoštevanju ciljnega uporabnika, saj je od tega odvisna marsikatera odločitev o vsebini in obliki slovarja. S tem v zvezi gre omeniti tudi predavanje o koristnosti izdelave predlog, tj. vzorčnih gesel z obveznimi in priporočljivimi elementi za skupine besed, ki pripadajo istemu razredu (npr. živali, dnevi v tednu, barve), da se izognemo nekonsistentnosti in leksikografom olajšamo delo. Načeta so bila tudi vprašanja črpanja podatkov o jeziku, kjer so bili ocenjevalno sopostavljeni različni viri: introspekcija, obstoječi jezikovni viri (npr. slovarji, slovnice), informacije rojenih govorcev, citatni lističi in korpusi. Ker se tehtnica s plusi močno nagiba v smeri proti korpusom, smo bili seznanjeni z osnovami korpusnega jezikoslovja, tako z gradnjo kot izrabo korpusov v leksikografske namene. Poudarek je bil predvsem na vprašanju, kako izbrati relevantne korpusne informacije za pisanje konkretnega geselskega članka. Ta vprašanja so seveda tesno povezana s procesom izdelave slovarske podatkovne zbirke, ki mora vsebovati vse glavne podatke o pomenskih in slovničnih lastnostih leksikalnih enot, kolokacijah, frekvenci, tipični rabi in nekaj tipičnih (realnih) zgledov rabe. Na kratko je bila predstavljena teorija semantičnih shem (frame semantics), njena uporabnost v leksikografiji ter osnove dvojezične leksikografije. Ukvarjali pa smo se tudi z zelo pomembnimi in vse prej kot trivialnimi vprašanji določanja pomenov večpomenskih leksemov, slovarske obravnave prenesenih pomenov in oblikovanja definicij v enojezičnih slovarjih. Prav v tem delu smo bili podrobneje seznanjeni z različnimi teorijami, zgodovinskimi in sodobnimi rešitvami v angleških slovarjih ter s primeri dobre in slabe prakse. Ti se nanašajo na združevanje in ločevanje pomenov, razvrščanje pomenov v slovarskem geselskem članku ter problematiko različnih pristopov k oblikovanju definicij in odločitev o njihovi obliki, vsebini in funkciji. Na tem mestu nismo dobili enoznačnih odgovorov na primer o tem, kaj je dobra definicija, ker je vprašanje večplastno in taki odgovori niti niso mogoči, so pa bili konkretni primeri dovolj pomenljivi za posredovanje navodil, na kaj vse mora leksikograf paziti, ko se loteva teh zahtevnih nalog. Predstavljene jezikovnotehnološke vsebine so obravnavale načela zasnove in gradnje korpusov, gradnjo korpusov iz gradiva, dostopnega na spletu, ter prednosti uporabe specializiranih računalniških orodij za sestavo slovarjev. Med predavanji, ki so zahtevala nenehno sodelovanje udeležencev, smo se seznanili s številnimi funkcijami orodja Word Sketch Engine (http://www. sketchengine.co.uk) in z uporabo regularnih izrazov za naprednejše iskanje po označenih

150 Ocene in poročila korpusih (Corpus Query Language) ter pisanje gramatik. Pobliže smo spoznali tudi BootCat (http://corpora.fi.muni.cz/bootcat), orodje za gradnjo spletnih korpusov, in enega izmed zmogljivejših orodij za sestavo slovarjev, TshwaneLex, ki ga je na povabilo predavateljev predstavil Gilles-Maurice de Schryver iz podjetja TshwaneDJe HLT (http://tshwanedje.com/tshwanelex). Predavanja so bila večinoma izvedena v prvih dneh delavnice, saj je bil četrtkov dan namenjen samostojnemu praktičnemu delu, petkov pa oceni naših izdelkov in premisleku o prihodnosti. Kljub precej omejenemu času so predavanja zaobjela zelo veliko vsebin, kar se seveda pozna pri manj intenzivnem poglabljanju v problematiko in manjši pluralnosti prikazanih teorij, pristopov in konkretnih rešitev. Vendar pa od tovrstnih intenzivnih tečajev kaj takega tudi ne gre pričakovati, sploh če je ciljna publika strokovna in naj bi torej bila po področju razgledana. Se pa je ravno zaradi tega zastavljalo vprašanje relevantnosti odpredavanih vsebin, saj se vsaj na prvi pogled zdi, da bi vsakdo, ki se kakorkoli ukvarja z leksikografijo in jezikovnimi tehnologijami, te vsebine vsaj deloma moral poznati že prej. Temu je najverjetneje botrovala velika heterogenost skupine udeležencev, ki smo izhajali iz zelo različnih okolij, bili različno stari, različnih strokovnih profilov in z različnimi izkušnjami. S stališča podiplomskih študentk, ki sva med študijem pridobili teoretične osnove v obravnavanih temah in imava z njimi že nekaj konkretnih izkušenj, pa lahko rečeva, da je bila osvežitev znanja dobrodošla, še posebej zato, ker je bila dopolnjena z nadgradnjo, spoznavanjem stanovskih kolegov in skoraj nenehno pripravljenostjo predavateljev odgovarjati na naša še kako raznovrstna vprašanja. Praktično leksikografsko delo je bilo povezano z izdelavo geselskih člankov dveh angleških besed, in sicer na podlagi podatkov iz korpusa BNC (British National Corpus), ki smo ga pregledovali s pomočjo orodja Word Sketch Engine. Že prvi dan delavnice smo se morali spopasti z besedo honeymoon (medeni tedni), ki je bila zaradi nizke frekvence in ne preveč zapletene semantične vrednosti leksikografu zelo prijazna, kljub temu pa po skupinah nismo oblikovali identičnih geselskih člankov in je bila tako vaja dober uvod v nadaljnja predavanja o problemih, s katerimi se leksikografi spopadajo pri vsakdanjem delu. Po»prijetnih medenih tednih«pa je nastopilo nekoliko bolj napeto delovno vzdušje, ko smo se v četrtek ukvarjali z izrazom tense (napet, napeti, čas). Naša naloga je bila izdelati geselski članek za enojezični slovar za tujce in dvojezični angleško-x slovar. Pri skupinskem delu se je pokazalo, da imamo zelo različne poglede na to, kako se lotiti takšne naloge, pa tudi pri pogajanjih o končnih odločitvah so posamezniki odločno zagovarjali svoje rešitve. Kakorkoli že, večinoma nam je v skupinah uspelo sestaviti vsaj en geselski članek, petkova debata o naših zadregah in rešitvah pa je bila zelo plodovita in poučna. Praktični del jezikovnotehnološke sekcije je letos potekal v nekoliko okrnjeni obliki, saj so bili interesi večine udeležencev izrazito jezikoslovno obarvani, dinamiko delavnice pa je še dodatno upočasnil tehnološko nespretno rešen dostop do interneta. A kljub temu nam je uspelo podrobno preizkusiti vso zmogljivost orodja Word Sketch Engine, s pomočjo BootCata pa vsakemu sestaviti svoj spletni korpus. Tega smo nato dodali v Word Sketch Engine in pravkar naučene tehnike iskanja po angleškem korpusu preizkusili tudi v svojem jeziku. BootCat se je izkazal kot priročno orodje za hitro gradnjo tematsko specializiranih korpusov iz gradiva, dostopnega na spletu, za angleščino, nemščino, francoščino, italijanščino in španščino pa omogoča tudi besednovrstno označevanje in lematizacijo. Tako pripravljen korpus je nato mogoče preiskovati z orodjem Word Sketch Engine, ki poleg konkordančnika ponuja možnosti iskanja kolokacij, slovničnih relacij med besedami, semantično sorodnih besed in primerjave podobnosti in razlik med dvema izrazoma.

Ocene in poročila 151 Za konec. Po napornem tednu so organizatorji že sicer odlično izveden seminar popestrili še s skupno večerjo, ki smo jo vsi prisotni z veseljem izkoristili za intenzivno druženje in izmenjavo izkušenj. Poleg dobre organizacije pa gre izpostaviti še izčrpno seminarsko gradivo z zapiski s predavanj in vajami, ki so ga za udeležence pripravili predavatelji. Seminar smo zaključili zazrti v prihodnost, ki naj bi prinesla celovitejše rešitve za računalniško podprto leksikografijo, še večjo integracijo korpusov in slovarjev ter inteligentnejšo ponudbo slovarskih informacij za specifičnegauporabnika. Zaradi velikega števila udeležencev iz Slovenije, ki priča o potrebnosti tovrstnih izobraževanj v našem prostoru, pa si za konec zaželimo še, da bi podobne leksikografske delavnice prav kmalu zaživele tudi pri nas. Darja Fišer in Tadeja Rozman Univerza v Ljubljani, Filozofska fakulteta darja.fiser1@guest.arnes.si tadeja.rozman@ff.uni-lj.si