latinica

Друштво младих лингвиста је током 2014. године организовало три радионице и један мини-семинар. Радионице су биле посвећене претраживању електронских извора информација и писању и презентовању научних радова. На мини-семинару чланови Друштва упознали су се са основама корпусне лингвистике и Корпусом савременог српског језика. 


 

Корпусна лингвистика и Корпус савременог српског језика

С обзиром на то да се лингвистичка истраживања данас све чешће заснивају на корпусу, Друштво младих лингвиста је за своје чланове организовало семинар посвећен основама корпусне лингвистике. На овом семинару чланови су такође могли да се упознају и са Корпусом савременог српског језика, који се израђује на Математичком факултету Универзитета у Београду. Радионица је одржана 24. маја 2014. године у Научном клубу Центра за промоцију науке и текла је овако:

11.00 – 12.30 др Маја Миличевић: Корпусна лингвистика као метод у истраживањима језика

Савремена истраживања језика обавезно се раде на корпусу. Шта је, у ствари, корпус? То је, најпростије речено, грађа. У ширем смислу, под корпусом се подразумева било каква збирка текстова сакупљена по одређеном критеријуму, а у ужем смислу – та збирка текстова је у електронском формату и машински читљива и самим тим циљано претражива. Бржа, лакша и прецизнија претрага могућа је због тога што текстови садрже додатне информације, и то ванлингвистичке, у виду аутора текста, времена настанка текста, жанра којем текст припада, али и лингвистичке, будући да су корпуси углавном лематизовани (тј. за сваку реч је наведен њен основни облик - лема) и све више морфолошки и синтаксички анотирани (тј. за сваку реч су наведене морфолошке категорије и синтаксичке позиције).
Корпусна истраживања су, заправо, истраживања језичких појава која се темеље на подацима добијених из електронских корпуса, у којима су забележене употребе тих појава. Оваква истраживања нису нова: до половине XX века прикупљање података из одабраног корпуса у виду штампаних издања и бележење релевантних примера била је најчешћа метода. Међутим, генеративизам је корпусе одгурнуо у страну, критикујући њихову ограниченост (у односу на језичку бесконачност) и приказивање перформансе (што је само мали део језичке компетенције). Срећом, појава рачунара довела је до тога да корпуси поново добију на цени. Још шездесетих година почео је да се развија Браунов корпус, који је постао узор каснијим корпусима. Осамдесетих година почињу да се израђују вишемилионски корпуси, пре свега за потребе лексикографије. Почетком деведесетих настаје Британски национални корпус, један од најзначајнијих корпуса. Данас постоје корпуси за велики број језика, који се мере милионима и чак милијардама речи.
Различити корпуси су доступни корисницима у различитом облику и под различитим условима. Најчешће се корпусима приступа путем веб интерфејса и приступ је углавном слободан или уз бесплатну регистрацију. Поједини корпуси су доступни у виду изворних текстова; такви корпуси су драгоцени јер се могу претраживати и анализирати помоћу алата (AntCon, NoSketch Engine, Sketch Engine, Corpus Workbench).
Корпуси се могу употребити у различите истраживачке сврхе: за добијање примера употребе неке речи или конструкције, зарад пребројавања језичких података (у првом реду учесталости употребе језичких јединица), у циљу сазнавања односа конкуретних облика (нпр. инфитив vs. да + презент), ради увида које речи чине колокације, итд. Начин употребе корпуса зависиће од конкретног истраживачког питања, али и од могућности које корпус пружа.

12.30 – 13.00 Пауза

13.00 – 14.30 Др Маја Миличевић: Врсте и процене карактеристика корпуса

Корпуси се могу поделити по различитим критеријумима. Према критеријуму језика корпуси могу бити једнојезични и вишејезични. Треба имати на уму да се овде под језиком подразумевају и варијетети унутар једног језика. Наменски гледано, могу се издвојити општи и специјализовани корпуси. Општи (референтни) корпуси теже да представе читав језик, у свим његовим облицима/варијететима/стиловима. Специјализовани корпуси се ограничавају на одређени варијетет или на одређене говорнике (дијалекатски, преводни, дечји, ученички и сл. корпуси). С обзиром на временску димензију, корпуси могу бити синхронијски и дијахронијски, а с обзиром на медијум у којем су настали текстови из корпуса – говорни, писани и мултимодални (и говорни и писани). Уколико се корпус након што се израда заврши више не мења, у питању је статички корпус, а уколико се корпус стално или повремено допуњује новим текстовима – динамички.
Како корпус заправо представља узорак целокупне језичке популације, главно питање је како постићи репрезентативност и балансираност. Репрезентативност значи да корпус треба да буде реплика језика у малом, а балансираност се тиче мере у којој су заступљени различити типови текстова. Дакле, корпус треба да буде састављен од различитих жанрова (говорни/писани, формални/неформални итд.), а заступљеност жанрова у корпусу треба да буде једнака заступљености жанрова у језичкој употреби.
Што се величине корпуса тиче, треба се руководити принципом „што више, то боље“. Општи корпуси броје најмање 100 милиона речи, али специјализовани имају много мање.
Корпуси сем самих текстова садрже и информације о тим текстовима. Те информације могу бити ванлингвистичке (жанр, аутор, време настанка, језик...) и лингвистичке (врста речи, морфолошке категорије, синтаксичке функције...). Процес лингвистичког обележавања текста назива се анотација. Она може бити морфолошка, синтаксичка, семантичка, дискурсна. Најчешћа је морфолошка анотација, под којом се подразумева лематизација (одређивање основног облика речи – леме), тагирање (обележавање врсте речи) и морфосинтаксичка дескрипција (обележавање граматичких/морфолошких категорија – рода, броја, падежа...). Анотирани  корпус много олакшава лингвистичка истраживања, јер се путем регуларних израза или језика за претрагу корпуса брзо добијају подаци. Резултати претраге се добијају у виду конкорданци (приказа кључне речи у контексту), фреквенцијских листи, колокацијских листи...

14.30 – 15.30 Пауза

15.30 – 17.00 Др Милош Утвић: Корпус савременог српског језика

Идеја о Корпусу савременог српског језика постоји још од осамдесетих година 20. века, када је започето сакупљање текстова и њихова дигитализација, али је тек пре десетак година у оквиру Групе за језичке технологије Математичког факултета конструисана и објављена прва верзија. Та верзија није садржавала библиографске податке о текстовима, нити је била лингвистички анотирана, већ је, просто, била колекција неанотираних текстова, па је названа Неетикетирани корпус српског језика (НЕТК). Додуше, корпус се могао претраживати помоћу регуларних израза, а као резултат добијале су се конкорданце, што је било значајно за истраживања будући да је корпус још тада био велики – бројао је 22, 2 милиона корпусних речи. НЕТК је касније допуњен библиографским информацијама о корпусним текстовима и тако је настао СрпКор2003. Даљим уношењем текстова створена је текућа верзија СрпКор-а, СрпКор2013, која садржи 4889 углавном писаних текстова. Највише текстова је из новина (66%), затим следе административни (19%), књижевно-уметнички (7%), научни и научнопопуларни текстови (4%). Иако СрпКор претендује да буде општи корпус, још увек није достигао пожељну балансираност текстова, пошто је удео новинских текстова велики. Већина текстова (87%) објављена је после 2000. године, што ће рећи да је у питању синхронијски корпус. СрпКор2013 броји више од 122 милиона корпусних речи и претражив је помоћу CQP (Corpus Query Processor), будући да је библиографски и морфолошки анотиран. Библиографска анотација, поред уобичајеног библиографског описа (наслов, аутор, година издања и сл.), садржи и информације о функционалном стилу којем припада текст, као и информације о томе да ли је текст написан на српском језику или је превод са неког страног језика. Под морфолошком анотацијом се у оквиру овог корпуса подразумева лематизација и приписивање врсте речи. Иако непотпуна, оваква анотација омогућава да се корпус претражује помоћу широке лепезе упита (нпр. [pos = "V" &  pos = "N"] – узастопце глагол и именица, [pos = "A" &  lemma = ".*ski"] – придеви који се завршавају на –ски и сл.), што раније није било могуће. На овај начин, финијом претрагом, која даје прецизније податке, СрпКор је омогућио да се стекне бољи увид у функционисање српског језика. Корпус је доступан свима уз претходну бесплатну регистрацију на следећој адреси: http://www.korpus.matf.bg.ac.rsДа би се креирао налог помоћу којег се приступа корпусу, потребно је послати мејл на Ова адреса ел. поште је заштићена од спамботова. Омогућите JavaScript да бисте је видели.

Након излагања чланови Друштва су претраживали корпус на основу унапред припремљених задатака. Циљ ових задатака је био да се чланови опробају у претрази СрпКор-а како би увидели његове могућности и тако стекли слику о евентуалним будућим лингвистичким истраживањима базираним на корпусу.

Додај коментар (0)

ПРЕЗИ радионица

У последње време постале су популарне презентације направљене у Презију, будући да су динамичније од презентација у Power Point-у, па је Друштво младих лингвиста желело да своје чланове упозна са предностима Презија и да их научи како могу да направе овакве презентације, а све у циљу да резултате својих истраживања представе на најбољи могући начин. Зато је Друштво организовало ПРЕЗИ радионицу 17. маја 2014. године од 15 до 17 часова у Канцеларији за младе.

Прези је алат за прављење презентација заснован на сасвим другачијем концепту од класичних. Заснован je на клауд технологији; он се не инсталира, већ му се приступа као сајту, што ће рећи да не заузима простор на рачунару. Наравно, за оне који воле офлајн рад, постоји и десктоп верзија.
Презентације које се праве у Презију зову се – презији. Користи се виртуелно „платно” које имитира школску таблу, на коју се стављају елементи презентације: текст, слике, видео... На екрану се аутоматски појављује прозор са шаблонима, па корисник може изабрати неки од њих. Шаблони имају већ одређену позадину, фонтове, рамове, путању. Али, сваки детаљ, од фонтова до боја, могуће је мењати и прилагодити свом укусу.
Путања представља низ објеката (рамова, слика, текста...) на које ће се зумирати. Приликом презентовања корисник прати путању, јер она одсликава редослед излагања. Али путања није визуелно линеарна, већ заправо представља хијерархијску структуру, па је упечатљивија и лакша за памћење. Зумирањем се може сагледати целина, али и концентрисати се на детаље, што је једна од погодности које пружа Прези.
Предност Презија је и у томе што је идеалан за сарадњу: омогућава заједнички рад на презијима у реалном времену.
У основној верзији је бесплатан, а за напредне верзије треба платити одређену суму. Међутим, Прези је посебно наклоњен образовним институцијама, па је тако за све ученике, студенте, професоре са мејл адресом институције омогућено регистровање под посебним условима. 

Радионицу је водио Никола Спасојевић, амбасадор Презија на Универзитету у Београду. Његове презије можете видети овде

У првом делу радионице Никола Спасојевић је објаснио шта је Прези и како се праве презији. У другом делу радионице су чланови Друштва могли сами да се окушају у прављењу презија. Никола Спасојевић им је помагао да остваре оно што су наумили, али и да учине презентацију што ефектнијом.  

Додај коментар (0)

Како написати и презентовати научни рад?

С обзиром на то да се на студијама не развијају вештине писања и презентовања научног рада, а неопходно је да млади истраживачи добију смернице како то урадити да би одговорили на захтеве које им поставља академска заједница, Друштво младих лингвиста је за своје чланове организовало радионицу Како написати и презентовати научни рад?. Радионица је одржана 17. маја 2014. године у периоду од 11 до 14.30 часова у Канцеларији за младе и текла је овако:

11.00 – 12.20 Увод у писање научног рада (мр Сњежана Ћирковић, Филолошки факултет Универзитета у Београду)

Научни рад представља производ научног истраживања у којем су изложени оригинални резултати и објашњења до којих је истраживач дошао служећи се методолошким апаратом одређене научне дисциплине. Почетак научног истраживања, када треба дефинисати проблем, нарочито тешко пада почетницима у науци, јер треба усагласити неколико критеријума: значај, актуелност, применљивост проблема, интересовање истраживача за проблем, стручност истраживача, могућност спровођења истраживања (укључујући доступност грађе и метода). Проблем научног истраживања треба да буде тако постављен да се очекује да ће се након истраживања доћи до нових података или објашњења. Дакле, циљ сваког научног истраживања јесте да се (додатно) расветли постављени проблем. У зависности од природе проблема и/или афинитета истраживача, циљеви, грубо речено, могу бити епистемолошки (тичу се нивоа сазнања које истраживач жели да досегне) или апликативни (тичу се примене или имплементације сазнања до којих је истраживач дошао). Како би достигао циљ истраживања, истраживач поставља хипотезе (претпоставке) у вези са проблемом, које током истраживања доказује или оповргава. Да би проверио сопствене хипотезе, истраживач се служи научним методама. Треба разликовати методе за прикупљање података (анкета, интервју, посматрање, експеримент, анализа садржаја) и методе за анализу прикупљених података (аналитичке, синтетичке, статистичке, упоредне). Проверавајући своје хипотезе научним методама, истраживач долази до парцијалних закључака, које затим обједињује како би сазнао да ли је постављени циљ истраживања достигнут и да ли је постављени проблем решен. Да би резултати до којих је истраживач дошао добили на значају, истраживач те резултате мора да представи научној јавности, најчешће тако што ће написати и објавити научни рад. Научни рад треба да има следећу структуру: насловна страна, сажетак и кључне речи, садржај, списак цртежа, табела, илустрација (ако постоји), списак скраћеница (ако постоји), главни део рада, библиографија, прилози/додаци (ако постоје). У главном делу рада треба дати хронологију истраживања онако како је оно заиста реализовано, кроз уобичајене фазе (постављање проблема, информисање о досадашњим истраживањима, постављање хипотеза, одабир методологије, спровођење истраживања, анализа резултата, тумачење резултата, навођење закључака). При том, приликом писања треба обратити пажњу на принципе логичности, прецизности, кохерентности, кохезивности, концизности, тј. реченице треба писати јасно и прецизно, хронолошким или узрочно-последичним редоследом, тако да представљају јединствену и складну целину. Приликом уређивања форме научног рада могу се искористити алати доступни у оквиру Microsoft Word програма (Styles, Table of Contents, Footnotes, Citations&Bibliography, Index…).

12.20 – 12.30 Пауза

12.30 – 13.00 Технике напредног претраживања (мр Сњежана Ћирковић, Филолошки факултет Универзитета у Београду)

Једна од битних вештина којима истраживач треба да овлада како би дошао до ваљаних информација за своје истраживање је претраживање електронских извора. За проналажење информација могу се користити следећи извори: Узајамни онлајн каталог COBISS OPAC, KVK – Karlsruher Virtueller Katalog, КоБСОН, СЦИндекс.
Узајамни онлајн каталог Србије је успостављен спајањем библиографско-каталошких база Библиотеке Матице српске, Народне библиотеке Србије, Универзитетске библиотеке „Светозар Марковић“ и некадашњег Југословенског библиографско-информацијског института, тзв. ЈУБИН-а, на платформи COBISS. У оквиру ове платформе могуће је претраживање на три нивоа: основном, изборном, командном. Након укуцаних одређених података о  траженој публикацији/чланку, као резултат добијају се не само информације о тој публикацији/чланку, већ и у којим библиотекама се она може наћи. Високошколске библиотеке (укључујући катедарске библиотеке Филолошког факултета Универзитета у Београду) такође се налазе у систему COBISS, па их је могуће претражити.
KVK (Karlsruher Virtueller Katalog) је метакаталог који садржи податке о преко 500 милиона књига и часописа који се чувају у библиотекама широм света. KVK нуди избор великог броја каталога у оквиру којих је могуће претраживати. Само претраживање може бити на основу различитих критеријума: аутор, наслов, година издања, издавач, кључна реч, ISBN/ISSN. KVK, након укуцаних података по критеријумима претраге, сортира резултате по каталозима и нуди везу ка месту где се одређена публикација налази.
КоБСОН (Конзорцијум библиотека Србије за обједињену набавку) је основан са циљем да се оптимизује набавка стране научне литературе у електронском облику, али и да се промовише домаће научно издаваштво, које преко ове платформе постаје видљиво светској научној заједници. У оквиру КоБСОН-а могуће је приступити електронским издањима бројних научних часописа и књига. Посебно су значајнe индексне базе и сервиси (Web of Science, JSTOR, Science Direct) и репозиторијуми докторских дисертација у електронском облику (Open Access Theses and Dissertations, EThOS - Electronic Theses online service, Digitalni akademski repozitorij).
Српски цитатни индекс (СЦИндекс) настао је као допуна међународним цитатним индексима. У СЦИндексу је могуће претраживати преко 400 домаћих научних часописа из различитих научних дисциплина. Посебна погодност је што су чланци у појединим часописима доступни у пуном тексту, а не само до нивоа сажетка. Такође, у оквиру СЦИндекса прате се сциентометријски подаци попут импакт фактора часописа или броја цитата одређеног рада.

13.00 – 13.30 Библиографско цитирање (мр Сњежана Ћирковић, Филолошки факултет Универзитета у Београду)

Саставни део сваког научног рада представљају цитати. Цитирањем се успоставља комуникација са другим истраживачима који се баве истом или сличном темом, представља се еволуција научне мисли о одређеној теми, повезују се научни радови о одређеној теми у укупно научно знање, реагује се на раније тврдње са циљем да се своји нови и оригинални резултати прикажу као валидни. Постоје три начина цитирања: дословно навођење (преписивање туђих речи), парафразирање (сопственим речима објаснити туђе мисли), резимирање (сопственим речима сажети рад у виду кључне идеје). Без обзира на начин, приликом цитирања треба коректно наводити извор (тј. аутора, наслов и број стране) јер се тако поштују научни ауторитет и ауторска права других истраживача. Подаци о изворима наводе се у оквиру самог текста рада и у библиографији. У оквиру самог текста рада извори се могу навести према два система: система нотација (навођење извора у фусноти) или система аутор-датум (навођење аутора и године издања рада у заградама након цитата/парафразе). У библиографији извори се наводе у складу са изабраним стилом библиографског цитирања (АПА, МЛА, Чикаго, Харвард). Избор стила зависи од ментора, политике научног часописа, досадашњег коришћења тог стила у одређеној научној дисциплини. Како би се помогло истраживачима, осмишљени су програми који одређену публикацију преводе у библиографски запис према изабраном стилу (доступни преко LibGuides на сајту Универзитетске библиотеке „Светозар Марковић“ у Београду). Такође, у оквиру СЦИндекса постоји опција „Како цитирати овај чланак?“.
Преузимање туђих речи и ставова, без навођења тачних и проверљивих библиографских података, сматра се плагијатом. Зато је важно овладати техникама библиографског цитирања.

13.30 – 13.45 Пауза

13.45 – 14.30 Презентација научног рада (мр Сњежана Ћирковић, Филолошки факултет Универзитета у Београду)

Задатак истраживача није само да спроведе истраживање, већ и да резултате тог истраживања представи научној јавности, најчешће путем презентација на конференцијама. Излагање на конференцијама потпомогнуто Power Point презентацијама оставља снажнији утисак на публику, па се мултимедијални начин излагања препоручује. Power Point презентација треба да буде организована логично, дајући преглед информација, које својом укупношћу чине складну целину. Први слајд треба да садржи наслов презентације, име аутора и његову афилијацију. На другом слајду даје се садржај презентације у кратким цртама. На слајдовима треба исписати тезе (а не целе реченице!), а битне појмове или кључне речи истицати, како би се скренула пажња публици. Што се боја тиче, треба бити умерен (оптимално је да су на презентацији три боје) и изабрати оне боје којима се остварује јак контраст између позадине и текста. Слично треба поступати са визуелним и аудитивним средствима (слике, музика) и анимацијама. Са анимацијама треба бити опрезан јер могу одвући пажњу публике. Зато анимације треба користити онда када се жели постићи одређени ефекат. На крају презентације увек треба дати резиме и извести закључке. Број слајдова по презентацији зависи од теме, али се за 15-минутну презентацију препоручује 5-7 слајдова, с тим што број редова по слајду не би требало да буде већи од седам.
Вештине презентовања се данас све чешће захтевају од научног радника управо зато што је важно своја сазнања предочити другима и заинтересовати их за даљи рад у оквиру одређене теме/пројекта.

Радионица је била врло интерактивна: чланови Друштва су отворено говорили о проблемима са којима су се сусретали у досадашњем раду, а мр Сњежана Ћирковић давала је савете како се одређени проблеми могу превазићи. Закључак радионице је да су вештине претраживања, писања, цитирања, презентовања данас неопходне вештине у науци и да је потребно све више пажње усмерити на развијање ових вештина.  

Додај коментар (0)

Претраживање електронских извора информација

 

Друштво младих лингвиста је у сарадњи са Универзитетском библиотеком „Светозар Марковић“ у Београду за своје чланове организовало радионицу под насловом Претраживање електронских извора информација. Циљ ове радионице био је да се члановима Друштва младих лингвиста представе Виртуелна библиотека Србије, електронски каталог Универзитетске библиотеке, водичи за научне области, дигитални репозиторијуми Е-тезе и DART, Google Scholar, као и да се обнови претраживање преко КоБСОН-а, с тим што ће се сада акценат ставити на Е-brary.
Виртуелна библиотека Србије (ВБС) је база података која, обједињујући каталоге бројних универзитетских, високошколских, специјалних и јавних библиотека у Србији, садржи више од 2 500 000 библиографских записа. Могуће је претраживање вршити у оквиру електронског каталога одређене библиотеке (па ће резултати претраге показати да ли запис који се тражи постоји у тој библиотеци) или у оквиру целокупне ВБС (па ће резултати претраге показати у којим библиотекама се налази запис који се тражи). Претраживање може бити основно, изборно (на основу следећих параметара: аутор, наслов, година, издања, кључне речи, језик, писмо), командно. Резултате претраживања могуће је конвертовати у библиографију и сачувати на свом рачунару или послати себи мејлом. Електронски каталог Универзитетске библиотеке „Светозар Марковић“ у Београду део је Виртуелне библиотеке Србије.
Универзитетска библиотека „Светозар Марковић“ припремила је неколико водича кроз научне области, у којима су сакупљени бројни релевантни електронски извори (LibGuides). Ови водичи могу помоћи онима који пишу научне радове да лакше пронађу одговарајућу литературу. Нажалост, водич за лингвистику није припремљен, али лингвистима од користи могу бити општи водичи посвећени отвореном приступу, ауторским правима, цитирању литературе и библиографским алатима, књигама у слободном приступу, масовним отвореним онлајн курсевима, али можда и специфичнији попут водича за класичне науке, филозофију, психологију, студије рода и феминистичку теорију.
У оквиру дигиталног репозиторијума Универзитета у Београду (PHAIDRA) постоје Е-тезе, систем у којем су похрањене докторске дисертације одбрањене на Универзитету у Београду у електронском облику. У овом систему могуће је претраживати докторске дисертације према научној области или факултету. На овај начин будући доктори наука имају прилику да из свог дома виде како докторска дисертација треба да изгледа. Докторске дисертације одбрањене у Србији од скоро су део европског портала докторских дисертација (DART). На овом порталу налази се скоро пола милиона одбрањених докторских дисертација на бројним универзитетима у електронском облику и доступне су у режиму отвореног приступа.
Приликом претраживања доступне литературе први корак је Google Scholar, део претраживача Google специјализован за претраживање научне литературе. Преко Google Scholar-а могуће је претраживати чланке, књиге, саопштења академских издавача и стручних друштава, као и дигиталне репозиторијуме бројних светских универзитета. За даље претраживање научне литературе треба користити базе података попут Science Direct и JSTOR. Овим базама података могуће је приступити преко КoБСОН-а, који пружа додатне погодности приликом претраживања (нпр. видљив је цео чланак, а не само до нивоа сажетка). Преко КoБСОН-а се може приступити и електронским књигама у оквиру Ebrary. Ова електронска библиотека садржи преко 100 000 књига из различитих научних области у пуном тексту. Начин рада са електронском књигом је идентичан као са традиционалном – може се подвлачити текст или дописивати коментар, али и користити се ресурсима попут енциклопедије и речника који су саставни део програма у којем се електронска књига чита.
Радионица је одржана 8. маја 2014. године у периоду од 11 до 14 часова у Универзитетској библиотеци „Светозар Марковић“ у Београду.  Предавачи су били Сања Антонић и Оја Кринуловић. Током радионице чланови Друштва младих лингвиста имали су прилике да разговарају са предавачима о својим досадашњим искуствима приликом претраживања и да сазнају како могу побољшати своју претрагу. Презентацију са радионице можете видети овде

Додај коментар (0)