<?xml version="1.0"?><rdf:RDF xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:edm="http://www.europeana.eu/schemas/edm/" xmlns:wgs84_pos="http://www.w3.org/2003/01/geo/wgs84_pos" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:rdaGr2="http://rdvocab.info/ElementsGr2" xmlns:oai="http://www.openarchives.org/OAI/2.0/" xmlns:owl="http://www.w3.org/2002/07/owl#" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:ore="http://www.openarchives.org/ore/terms/" xmlns:skos="http://www.w3.org/2004/02/skos/core#" xmlns:dcterms="http://purl.org/dc/terms/"><edm:WebResource rdf:about="http://www.dlib.si/stream/URN:NBN:SI:doc-QEBXBNTU/557a769e-b27e-42ac-9667-96bf34caf0b9/PDF"><dcterms:extent>538 KB</dcterms:extent></edm:WebResource><edm:WebResource rdf:about="http://www.dlib.si/stream/URN:NBN:SI:doc-QEBXBNTU/14615bfd-2e93-4357-b7a9-7e48e62ac28f/TEXT"><dcterms:extent>55 KB</dcterms:extent></edm:WebResource><edm:TimeSpan rdf:about="2013-2025"><edm:begin xml:lang="en">2013</edm:begin><edm:end xml:lang="en">2025</edm:end></edm:TimeSpan><edm:ProvidedCHO rdf:about="URN:NBN:SI:doc-QEBXBNTU"><dcterms:isPartOf rdf:resource="https://www.dlib.si/details/URN:NBN:SI:spr-BR18JCH2" /><dcterms:issued>2016</dcterms:issued><dc:creator>Erjavec, Tomaž</dc:creator><dc:creator>Fišer, Darja</dc:creator><dc:creator>Ljubešić, Nikola</dc:creator><dc:format xml:lang="sl">številka:2</dc:format><dc:format xml:lang="sl">letnik:4</dc:format><dc:format xml:lang="sl">str. 67-99</dc:format><dc:identifier>ISSN:2335-2736</dc:identifier><dc:identifier>COBISSID:62245218</dc:identifier><dc:identifier>URN:URN:NBN:SI:doc-QEBXBNTU</dc:identifier><dc:language>sl</dc:language><dc:publisher xml:lang="sl">Trojina, zavod za uporabno slovenistiko</dc:publisher><dcterms:isPartOf xml:lang="sl">Slovenščina 2.0</dcterms:isPartOf><dc:subject xml:lang="sl">gradnja korpusa</dc:subject><dc:subject xml:lang="sl">nestandardna slovenščina</dc:subject><dc:subject xml:lang="sl">računalniško posredovana komunikacija</dc:subject><dc:subject xml:lang="sl">spletna slovenščina</dc:subject><dc:subject xml:lang="sl">uporabniške spletne vsebine</dc:subject><dc:subject rdf:resource="http://www.wikidata.org/entity/Q796573" /><dcterms:temporal rdf:resource="2013-2025" /><dc:title xml:lang="sl">JANES v0.4| korpus slovenskih spletnih uporabniških vsebin|</dc:title><dc:description xml:lang="sl">The paper presents the current version of the Slovene corpus of netspeak Janes which contains tweets, forum posts, news comments, blogs and blog comments, and user and talk pages from Wikipedia. First, we describe the harvesting procedure for each data source and provide a quantitative analysis of the corpus. Next, we present automatic and manual procedures for enriching the corpus with metadata, such as user type, gender and region, and text sentiment and standardness level. Finally, we give a detailed account of the linguistic annotation workflow which includes tokenization, sentence segmentation, rediacritisation, normalization, morphosyntactic tagging and lemmatization</dc:description><dc:description xml:lang="sl">Namen pričujočega prispevka je preveriti vrednost korpusa Janes za normativistične raziskave. Korpus Janes namreč prinaša besedila, ki za razliko od gradiva v referenčnih korpusih večinoma niso jezikovno korigirana in zato realneje izkazuje tendence rabe oz. (ne)intuitivnost obstoječih jezikovnih pravil v širši jezikovni skupnosti. Za študijo primera smo izbrali zveze samostalnika z neujemalnim levim prilastkom (solo petje, RTV prispevek). Analiza razkriva: da se referenčni korpus Kres in korpus Janes glede zapisa teh zvez pomembno razlikujeta; da je raba tovrstnih zvez v korpusu Janes pogostejša in bolj raznolika kot v korpusu Kres; da se v obeh korpusih pojavlja visok delež zvez, ki v rabi izkazujejo variantnost v zapisovanju, tudi na ravni posameznih prilastkov; in - vsaj na prvi pogled - presenetljivo, da je raba v korpusu Janes konsistentnejša, kar nakazuje, da jezikovna regulacija obravnavanega problema povečuje variantnost v jezikovni rabi. Prispevek temelji na konferenčni temi, ki smo jo podatkovno in vsebinsko razširili, vključili smo tudi razpravo o možni nadaljnji obravnavi izbranega jezikovnega problema, širše pa o pomenu in načinu vključitve korpusa Janes v metodologijo slovenske normativistike</dc:description><edm:type>TEXT</edm:type><dc:type xml:lang="sl">znanstveno časopisje</dc:type><dc:type xml:lang="en">journals</dc:type><dc:type rdf:resource="http://www.wikidata.org/entity/Q361785" /></edm:ProvidedCHO><ore:Aggregation rdf:about="http://www.dlib.si/?URN=URN:NBN:SI:doc-QEBXBNTU"><edm:aggregatedCHO rdf:resource="URN:NBN:SI:doc-QEBXBNTU" /><edm:isShownBy rdf:resource="http://www.dlib.si/stream/URN:NBN:SI:doc-QEBXBNTU/557a769e-b27e-42ac-9667-96bf34caf0b9/PDF" /><edm:rights rdf:resource="http://creativecommons.org/licenses/by-sa/4.0/" /><edm:provider>Slovenian National E-content Aggregator</edm:provider><edm:intermediateProvider xml:lang="en">National and University Library of Slovenia</edm:intermediateProvider><edm:dataProvider xml:lang="sl">Trojina, zavod za uporabno slovenistiko</edm:dataProvider><edm:object rdf:resource="http://www.dlib.si/streamdb/URN:NBN:SI:doc-QEBXBNTU/maxi/edm" /><edm:isShownAt rdf:resource="http://www.dlib.si/details/URN:NBN:SI:doc-QEBXBNTU" /></ore:Aggregation></rdf:RDF>