{"id":2359,"date":"2011-04-15T00:26:47","date_gmt":"2011-04-14T23:26:47","guid":{"rendered":"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/?p=2359"},"modified":"2011-04-17T06:39:11","modified_gmt":"2011-04-17T05:39:11","slug":"korpora-fur-deutsch-c4","status":"publish","type":"post","link":"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/2011\/04\/15\/korpora-fur-deutsch-c4","title":{"rendered":"Korpora f\u00fcr Deutsch: C4"},"content":{"rendered":"<p>Schon als ich das erste Mal von Korpuslinguistik geh\u00f6rt habe, war ich begeistert. Die Idee, schauen zu k\u00f6nnen, wie andere die Sprache benutzen und sich nicht nur auf die eigene Introspektion verlassen zu m\u00fcssen, hat mich sofort \u00fcberzeugt. Es ist deshalb nicht weiter verwunderlich, dass es hier im Blog schon einige Beitr\u00e4ge rund um Korpora gibt, zum Beispiel zum <a href=\"\/blog\/wordpress\/2006\/12\/23\/wortschatz-die-menge-machts\">Wortschatzprojekt der Uni-Leipzig<\/a>, zum <a href=\"\/blog\/wordpress\/2010\/10\/11\/tatoeba-satzworterbuch\">Satzw\u00f6rterbuch Tatoeba<\/a>, zur Verwendung von <a href=\"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/2005\/06\/20\/fugenelemente\">Google als Testwerkzeug<\/a> f\u00fcr Sprachproduktion, zur<a href=\"http:\/\/corne\/blog\/wordpress\/2009\/05\/02\/linguee-paralleltextsuchmaschine\"> Paralleltextsuchmaschine Linguee<\/a> oder zum <a href=\"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/2005\/06\/17\/dwds-digitales-worterbuch-der-deutschen-sprache-des-20-jahrhunderts\">DWDS<\/a> (=digitales W\u00f6rterbuch der deutschen Sprache des 20. Jahrhunderts).<\/p>\n<p>Entsprechen habe ich mich auch gefreut, als Thomas Studer an der Ledafids-Tagung einige Korpora f\u00fcr Deutsch vorgestellt hat, die ich noch nicht kannte oder die es zumindest noch nicht bis ins Blog geschafft haben.<\/p>\n<p>Die erste Entdeckung, der dieser Beitrag gewidmet ist, war <strong>C4<\/strong>, ein Koporationsprojekt des DWDS , des AAC (Austrian Academy Corpus), des Korpus S\u00fcdtirol und dem Schweizer Textkorpus (CHTK). Das besondere an dem Korpus ist also, dass es aus nationalsprachlichen Einzelkorpora besteht, die man sowohl als ganzes als auch nach Korpus gefiltert abfragen kann. Das deutsche und das Schweizer Korpus enthalten je 20. Mio. Textw\u00f6rter, der AAC 4.1 Mio und und das Korpus S\u00fcdtirol 1.7 Mio. Nachlesen kann man das auf der Einstiegsseite: <a href=\"http:\/\/chtk.unibas.ch\/korpus-c4\/search\">http:\/\/chtk.unibas.ch\/korpus-c4\/search<\/a>. Genaueres zur Zusammentstellung der einzelnen Korpora (=welche Textsorte aus welcher Zeitperiode kommt wie oft in welchem Korpus vor) kann man unter <a href=\"http:\/\/www.korpus-c4.org\/index.php?option=com_content&amp;view=article&amp;id=55&amp;Itemid=88\">Struktur<\/a> nachlesen. Man kann die Korpora ohne Login ben\u00fctzen, mit Login erh\u00e4lt man aber mehr Daten (<a href=\"http:\/\/chtk.unibas.ch\/korpus-c4\/terms\">Nutzungsbedingungen<\/a>).<\/p>\n<p>Im Men\u00fc \u00fcber der Suchmaske findet man einige wichtige Hilfsmittel wie den Filter (Korpus, Zeit, Textsorte &#8230;) und Beispiele f\u00fcr die Abfragesyntax. Es sind ziemlich komplexe Abfragen m\u00f6glich. Mit <em>&#8222;$Lemma=Entscheidung #5 $Lemma=treffen&#8220;<\/em> findet man alle S\u00e4tze, in denen irgend eine From von Entscheidung <strong>vor<\/strong> irgend einer Form von treffen im Abstand von h\u00f6chstens 5 W\u00f6rtern in einem Satz vorkommt. <em>$Lemma=Entscheidung &amp;&amp; $Lemma=treffen<\/em> liefert eine Liste von S\u00e4tzen in denen die beiden W\u00f6rter in beliebiger Reihenfolge in irgendeiner Form gemeinsam vorkommen. Auf diese Weise findet man schnell viele Beispiele\u00a0 f\u00fcr dieses\u00a0 Funktionsverbgef\u00fcge in verschiedensten grammatischen Formen, ohne dass man sie selber durchprobieren muss.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>C4 ist eine Korpussuchmaschine, mit der man Korpusdaten aus je einem Korpus aus Deutschland, \u00d6sterreich, dem S\u00fcdtirol und der Schweiz abfragen kann. Mehr dazu im Beitrag. <\/p>\n","protected":false},"author":24,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11,16,7,4],"tags":[30,300,10,172,94],"_links":{"self":[{"href":"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/wp-json\/wp\/v2\/posts\/2359"}],"collection":[{"href":"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/wp-json\/wp\/v2\/users\/24"}],"replies":[{"embeddable":true,"href":"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/wp-json\/wp\/v2\/comments?post=2359"}],"version-history":[{"count":5,"href":"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/wp-json\/wp\/v2\/posts\/2359\/revisions"}],"predecessor-version":[{"id":2376,"href":"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/wp-json\/wp\/v2\/posts\/2359\/revisions\/2376"}],"wp:attachment":[{"href":"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/wp-json\/wp\/v2\/media?parent=2359"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/wp-json\/wp\/v2\/categories?post=2359"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/wp-json\/wp\/v2\/tags?post=2359"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}