Korpora für Deutsch: C4

15. April 2011

Schon als ich das erste Mal von Korpuslinguistik gehört habe, war ich begeistert. Die Idee, schauen zu können, wie andere die Sprache benutzen und sich nicht nur auf die eigene Introspektion verlassen zu müssen, hat mich sofort überzeugt. Es ist deshalb nicht weiter verwunderlich, dass es hier im Blog schon einige Beiträge rund um Korpora gibt, zum Beispiel zum Wortschatzprojekt der Uni-Leipzig, zum Satzwörterbuch Tatoeba, zur Verwendung von Google als Testwerkzeug für Sprachproduktion, zur Paralleltextsuchmaschine Linguee oder zum DWDS (=digitales Wörterbuch der deutschen Sprache des 20. Jahrhunderts).

Entsprechen habe ich mich auch gefreut, als Thomas Studer an der Ledafids-Tagung einige Korpora für Deutsch vorgestellt hat, die ich noch nicht kannte oder die es zumindest noch nicht bis ins Blog geschafft haben.

Die erste Entdeckung, der dieser Beitrag gewidmet ist, war C4, ein Koporationsprojekt des DWDS , des AAC (Austrian Academy Corpus), des Korpus Südtirol und dem Schweizer Textkorpus (CHTK). Das besondere an dem Korpus ist also, dass es aus nationalsprachlichen Einzelkorpora besteht, die man sowohl als ganzes als auch nach Korpus gefiltert abfragen kann. Das deutsche und das Schweizer Korpus enthalten je 20. Mio. Textwörter, der AAC 4.1 Mio und und das Korpus Südtirol 1.7 Mio. Nachlesen kann man das auf der Einstiegsseite: http://chtk.unibas.ch/korpus-c4/search. Genaueres zur Zusammentstellung der einzelnen Korpora (=welche Textsorte aus welcher Zeitperiode kommt wie oft in welchem Korpus vor) kann man unter Struktur nachlesen. Man kann die Korpora ohne Login benützen, mit Login erhält man aber mehr Daten (Nutzungsbedingungen).

Im Menü über der Suchmaske findet man einige wichtige Hilfsmittel wie den Filter (Korpus, Zeit, Textsorte …) und Beispiele für die Abfragesyntax. Es sind ziemlich komplexe Abfragen möglich. Mit “$Lemma=Entscheidung #5 $Lemma=treffen” findet man alle Sätze, in denen irgend eine From von Entscheidung vor irgend einer Form von treffen im Abstand von höchstens 5 Wörtern in einem Satz vorkommt. $Lemma=Entscheidung && $Lemma=treffen liefert eine Liste von Sätzen in denen die beiden Wörter in beliebiger Reihenfolge in irgendeiner Form gemeinsam vorkommen. Auf diese Weise findet man schnell viele Beispiele  für dieses  Funktionsverbgefüge in verschiedensten grammatischen Formen, ohne dass man sie selber durchprobieren muss.

Post to Twitter Post to Delicious Post to Facebook

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (1 Stimmen, durchschnittlich: 5,00 von 5)
Laden ... Laden ...

Abgelegt unter: Für Lehrende,Für Lernende,Sprachbetrachtung,Wortschatz

Schlagwörter:, , , ,

1 Kommentar Kommentar schreiben

  • 1. Eva Lacroix  |  15. April 2011 um 05:16

    Wirklich interessant, Cornelia! Ein gutes Beispiel für eine benutzerfreundliche Bedienungsoberfläche.

Kommentar schreiben

(erforderlich)

(erforderlich), (Versteckt)

XHTML: Du kannst diese Tags verwenden: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

URL für Trackbacking  |  RSS -feed für Kommentare zu diesem Beitrag.


Linktipp

SPRACHLICH: Dies, DaF, ecetera.
Für Lernende (Aussprache, Grammatik, Hörverstehen und mehr) und Lehrende.

Kategorien

Neueste Kommentare

Blogs: DaF

Blogs: Lernende

Blogs: Sprache und (Online-)Lernen

DaF extern

 

April 2011
M D M D F S S
« Mrz   Mai »
 123
45678910
11121314151617
18192021222324
252627282930  

Meta

Stichwortsuche


  • (Spiel-)Vorlage (20)
  • A1 (154)
  • A2 (231)
  • Abzählverse (1)
  • Adjektive (1)
  • Advent (2)
  • Adventskalender (3)
  • akademisch (15)
  • ALSIC (1)
  • anfänger (5)
  • Anleitung (3)
  • Anleitungen (3)
  • App (5)
  • Arbeitsblatt (47)
  • Audacity (4)
  • Audio (55)
  • audio-lingua (5)
  • Audioforum (2)
  • Ausspracheregeln (12)
  • Ausspracheübung (32)
  • Aussprachewörterbuch (4)
  • authentisch (9)
  • authentische Texte (17)
  • Automatisierung (5)
  • autonomes Lernen (31)
  • Autorensoftware (10)
  • B1 (285)
  • B2 (260)
  • Babylonia (1)
  • Beamer (1)
  • Beruf (1)
  • Berufe (2)
  • Bewegung (1)
  • Bewerbung (1)
  • bewerten (1)
  • Bilder (7)
  • bildwörterbuch (1)
  • blix (2)
  • blogs (4)
  • Bräuche (3)
  • Businessdeutsch (1)
  • CC (12)
  • Computerlinguistik (1)
  • Creative Commons (23)
  • DACH(L) (14)
  • daf-blogosphäre (5)
  • dafwebkon (4)
  • DDR (2)
  • dekodieren (2)
  • Deskriptoren (1)
  • deutsche Welle (10)
  • Deutschland (4)
  • Dialekt (9)
  • Dialoge (3)
  • DICE (1)
  • Didaktik (5)
  • digitalisieren (1)
  • Diktat (8)
  • Diskussion (4)
  • diskutieren (7)
  • Durchsage (1)
  • dwds (2)
  • Einsatz von E-Learning (40)
  • Energie (3)
  • Englisch (3)
  • englischer Beitrag (14)
  • Essen (11)
  • Etymologie (1)
  • Fachsprache (5)
  • Fachwortschatz (2)
  • feedback (1)
  • Feiertage (5)
  • Flash (2)
  • Flüssigkeit (2)
  • Fragesätze (1)
  • Frauenstimmrecht (1)
  • Freizeit (2)
  • Fremdwörter (2)
  • Fugen-Element (2)
  • Fussball (1)
  • Gastbeiträge (1)
  • Gedächtnistraining (1)
  • Gedicht (1)
  • Genitiv (1)
  • GER (3)
  • Geschichte (7)
  • Gesellschaft (1)
  • gesprochene Sprache (1)
  • gesundheit (1)
  • GFL (1)
  • google (2)
  • Grammatik (4)
  • gruppenarbeit (12)
  • Handy (5)
  • Heidi (2)
  • Hilfsmittel (2)
  • Hirschfeld (1)
  • Hören und Sehen (41)
  • Hörsehverstehen (6)
  • Hörübung (20)
  • Hörverstehen (7)
  • Hotpotatoes (8)
  • html (1)
  • Humor (2)
  • IDT (22)
  • imperativ (2)
  • improvisieren (2)
  • IMS (1)
  • Info-DaF (1)
  • Interaktiv (10)
  • interkulturell (6)
  • Interview (6)
  • Intonation (4)
  • IPA (5)
  • Karten (3)
  • kollaborativ (2)
  • Kollokation (2)
  • Kölsch (1)
  • Kommunikation (3)
  • Komposita (7)
  • kontrastiv (2)
  • Korpora (2)
  • Kreuzworträtsel (2)
  • Krimi (3)
  • Kriterien (1)
  • Kurzfilm (2)
  • Kurzfilme (3)
  • Landessprachen (1)
  • learning-apps (3)
  • Lehrerrolle (2)
  • Lehrmittel (2)
  • lernerzentriert (31)
  • Lernplattform (6)
  • Lerntipps (30)
  • Lesen (1)
  • Lieder (2)
  • Literatur (2)
  • LL&T (2)
  • LMS (3)
  • lückenfüller (1)
  • Lückentexte (5)
  • Makros (1)
  • Männer und Frauen (2)
  • Mauer (1)
  • Medien (1)
  • mehrsprachig (36)
  • Methode (2)
  • Methodik (2)
  • Methodik A2 (1)
  • Minimalpaare (1)
  • mitlesen (1)
  • mitmachen (8)
  • mitsprechen (1)
  • mobiles Lernen (1)
  • Modalverben (3)
  • Multimediaintegration (1)
  • Multiple Choice (2)
  • Musik (1)
  • Musikvideo (8)
  • Nachrichten (3)
  • Nationalität (1)
  • Neurodidaktik (1)
  • nievau c (1)
  • Niveau C (204)
  • Niveau C1 (1)
  • ohne Vorkenntnisse (1)
  • ohne Login (6)
  • ohne Vorbereitung (2)
  • Open Office (1)
  • open source (2)
  • österreichisches Deutsch (5)
  • Partnerarbeit (13)
  • Passiv (1)
  • Pausierung (3)
  • Phonem-Graphem (19)
  • phonematisches Hören (9)
  • Phonetik (3)
  • phonologische Form (1)
  • plattformübergreifend (1)
  • Podcast (11)
  • Poesie (2)
  • Politik (5)
  • Portfolio (1)
  • präpositionen (1)
  • Präteritum (2)
  • Programme für E-Learning (49)
  • Projekt (14)
  • Projekte (1)
  • Projektorganisation (3)
  • Quiz (4)
  • quizlet (3)
  • Radio (1)
  • Radko (1)
  • Ratgeber (1)
  • Rechtschreibung (13)
  • Redemittel (3)
  • Reflexion (2)
  • Reisen (2)
  • Relativätze (1)
  • Ressourcen für E-Learning (40)
  • Rezension (16)
  • Rhythmus (4)
  • Rollenspiel (2)
  • Roman (2)
  • Satzakzent (1)
  • schnell (1)
  • Schweizer Hochdeutsch (31)
  • Schweizerisch (1)
  • Schweizerisches (87)
  • Schwyzerdütsch (10)
  • SCORM (1)
  • sehen (1)
  • selbeermachen (1)
  • selbermachen (20)
  • selektiv lesen (1)
  • selektives Hören (4)
  • selektives Lesen (1)
  • Silbe (8)
  • Skype (1)
  • Slideshare (4)
  • sms (1)
  • Spielfilm (4)
  • spielform (15)
  • sport (1)
  • Sprachbetrachtung (2)
  • Sprache (8)
  • Sprachkurs (2)
  • Sprachlerncommmunity (4)
  • Sprachlerncommunity (1)
  • Sprechaufgaben (2)
  • Sprechaufträge (2)
  • Sprechübung (3)
  • Stadtführung (2)
  • Standardsprache (6)
  • Statistik (8)
  • Statistiken (1)
  • Strategien (5)
  • Studium (1)
  • Südtirol (2)
  • Syntax (8)
  • Szeneprotokoll (1)
  • Tags (1)
  • Tandem (1)
  • Tandemlernen (7)
  • Tanskription (1)
  • technische Tipps (15)
  • Templates (1)
  • Test (2)
  • Text (1)
  • text-to-speech (1)
  • Textrekonstruktion (9)
  • Textsorte (1)
  • Theater (1)
  • Tourismus (5)
  • Traditionen (6)
  • Transkirpte (1)
  • Transkription (9)
  • übersetzen (1)
  • Übungsgenerator (4)
  • Umfrage (8)
  • Unterichtsidee (1)
  • Unterrichtsidee (3)
  • Untertitel (3)
  • Urheberrecht (2)
  • Varietäten (33)
  • VBZ (1)
  • Veranstaltungen (1)
  • verben (6)
  • Verkehr (2)
  • Verständlichkeit (1)
  • Video (123)
  • Videos (1)
  • Voice Thread (2)
  • Vokale (4)
  • Vorentlastung (2)
  • Vorlesen (3)
  • Vortrag (6)
  • Wechselspiele (3)
  • Wegbeschreibung (2)
  • Weihnachten (14)
  • Weiterbildung (3)
  • Werbung (6)
  • Wettbewerb (2)
  • wetter (1)
  • Whiteboard (2)
  • Wiki (2)
  • Wissenschaft (5)
  • wohnen (2)
  • Word (4)
  • wordpress (5)
  • Wortakzent (18)
  • Wortbildung (13)
  • Wörterbuch (3)
  • Wörterbuchbenutzung (3)
  • Wörterbücher (16)
  • Wortgruppenakzent (2)
  • Wortlisten (1)
  • Wortschatz (4)
  • Wortschatzliste (1)
  • Wortsuche (2)
  • Zahlen (2)
  • Zeit (1)
  • Zeitschrift (7)
  • zeitung (2)
  • ZIF (2)
  • Zungenbrecher (2)
  • Zuordnungsübung (5)
  • Zürich (1)
  • Zusamenfassung (2)