{"id":2134,"date":"2010-10-11T00:39:07","date_gmt":"2010-10-10T23:39:07","guid":{"rendered":"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/?p=2134"},"modified":"2010-10-11T16:53:09","modified_gmt":"2010-10-11T15:53:09","slug":"tatoeba-satzworterbuch","status":"publish","type":"post","link":"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/2010\/10\/11\/tatoeba-satzworterbuch","title":{"rendered":"Tatoeba &#8211; Satzw\u00f6rterbuch"},"content":{"rendered":"<p>Am Wochenende habe ich mal wieder ein sch\u00f6nes neues Spielzeug entdeckt, und wie das so ist mit Spielzeugen, habe ich ziemlich viel Zeit damit vergeudet, aber es hat sich durchaus gelohnt).\u00a0 Die Rede ist von<a href=\"http:\/\/tatoeba.org\/\"> Tatoeba<\/a>, einem W\u00f6rterbuch (man k\u00f6nnte auch sagen einem Korpus) f\u00fcr ganze S\u00e4tze.<\/p>\n<p><strong>Was ist Tatoeba?<\/strong><\/p>\n<p>In Tatoeba kann man (wenn man eingeloggt ist) zu jedem Satz eine oder mehrere \u00dcbersetzungen in allen m\u00f6glichen\u00a0 Sprachen anlegen. Auf diese Weise kann man, wenn man zum Beispiel den Englischen Satz &#8222;How are you?&#8220; \u00fcbersetzt, sowohl den Satz &#8222;Wie geht es Ihnen?&#8220;, als auch den Satz &#8222;Wie geht es dir?&#8220; aufnehmen. Wenn dann die deutschen S\u00e4tze weiter ins Franz\u00f6sische \u00fcbersetzt werden, wo der Sie-Du-Unterschied auch existiert, k\u00f6nnen sie direkt mit &#8222;Comment-allez vous?&#8220; bzw. &#8222;Comment-vas-tu?&#8220; verkn\u00fcpft werden. Die \u00dcbersetzungen sollen nicht wortw\u00f6rtlich sein, sondern m\u00f6glichst so klingen, wie sie ein Muttersprachler auch sagen w\u00fcrde.<\/p>\n<p>Die aktive Community ist zwar nicht riesig, aber &#8211; zumindest am Wochenende &#8211; sehr umtriebig. Beim Men\u00fcpunkt &#8222;Mitglieder&#8220; kann man eine Liste einsehen, welche Benutzer wie aktiv sind, woraus ersichtlich wird, dass einige sehr viel Zeit und M\u00fche in das Projekt investieren.<\/p>\n<p>Die gr\u00f6ssten Sprachen sind Englisch, Japanisch, Franz\u00f6sisch, Esperanto und Deutsch. Zahlreiche andere &#8211; f\u00fcr uns zum Teil ziemlich exotische Sprachen &#8211; sind aber ebenfalls Bestandteil des Projekts. Sehr sch\u00f6n ist, dass das Projekt nicht auf lateinische Schriften beschr\u00e4nkt ist. \u00dcberhaupt ist die Implementierung verschiedener Schriftsysteme sehr gut gel\u00f6st. Rechts- und linksb\u00fcndige Sprachen funktionieren problemlos nebeneinander, nicht lateinische Schriftzeichen scheinen \u00fcberhaupt kein Problem zu sein und f\u00fcr Chinesisch sind oft (immer?) sogar neben Pinyin und Kurzzeichen auch die Langzeichen angegeben.<\/p>\n<p>Die Gr\u00fcnderin von Tatoeba erkl\u00e4rt in diesem englischsprachigen Video selber, was die Idee hinter Tatoeba ist:<br \/>\n<object classid=\"clsid:d27cdb6e-ae6d-11cf-96b8-444553540000\" width=\"640\" height=\"390\" codebase=\"http:\/\/download.macromedia.com\/pub\/shockwave\/cabs\/flash\/swflash.cab#version=6,0,40,0\"><param name=\"allowFullScreen\" value=\"true\" \/><param name=\"allowScriptAccess\" value=\"always\" \/><param name=\"src\" value=\"http:\/\/www.youtube.com\/v\/ac9SmJuwHqk&amp;hl=en_US&amp;feature=player_embedded&amp;version=3\" \/><param name=\"allowfullscreen\" value=\"true\" \/><embed type=\"application\/x-shockwave-flash\" width=\"640\" height=\"390\" src=\"http:\/\/www.youtube.com\/v\/ac9SmJuwHqk&amp;hl=en_US&amp;feature=player_embedded&amp;version=3\" allowscriptaccess=\"always\" allowfullscreen=\"true\"><\/embed><\/object><\/p>\n<p><strong>Wie kann ich suchen?<\/strong><\/p>\n<p>Man kann das Korpus auf unterschiedliche Art und Weise durchst\u00f6bern. Oben gibt es eine Suchmaske, mit deren Hilfe man S\u00e4tze findet, die das gesuchte Wort enthalten. Man kann diese Resultate auf eine Sprache einschr\u00e4nken und zus\u00e4tzlich angeben, ob zu den S\u00e4tzen \u00dcbersetzungen in einer bestimmten Sprache vorhanden sein m\u00fcssen. Genauer suchen kann man mit boolschen Operatoren, <a href=\"http:\/\/sphinxsearch.com\/docs\/current.html#boolean-syntax\">wie zum Beispiel hier beschrieben<\/a>.<\/p>\n<p>Im Men\u00fcpunkt &#8222;Durchsuchen&#8220;, kann man w\u00e4hlen, ob man die Daten nach Sprache, Listen oder Tags durchst\u00f6bern will. Auf der Sprachansicht kann ich mir dann zum Beispiel alle Italienischen S\u00e4tze anzeigen lassen, die noch keine direkte Deutsche \u00dcbersetzung haben.<\/p>\n<p><strong>Wie kann ich mitmachen?<\/strong><\/p>\n<p><a href=\"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/wp-content\/uploads\/Bild-71.png\"><img decoding=\"async\" loading=\"lazy\" class=\"alignnone size-full wp-image-2136\" title=\"Bild 71\" src=\"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/wp-content\/uploads\/Bild-71.png\" alt=\"Bild 71\" width=\"57\" height=\"27\" \/><\/a>Zum Eingeben einer \u00dcbersetzung klickt man \u00fcber dem entsprechenden Satz einfach auf das Icon mit den Schriftzeichen. Dann kann man die \u00dcbersetzung eingeben. Wenn man mehrere deutsche \u00dcbersetzungen zu einem Satz eingeben will, klickt man einfach noch mal auf das Icon. Wichtig ist nur, dass immer tats\u00e4chlich der Satz fett ist, den man gerade \u00fcbersetzt. Die Sprache der \u00dcbersetzung muss man nicht angeben. Die automatische Spracherkennung ist sehr gut. Falls sie sich doch einmal irren sollte, kann man den S\u00e4tze, die man selber \u00fcbersetzt hat, durch anklicken editieren. (Eine Liste mit allen S\u00e4tzen, die einem geh\u00f6ren, findet man auf der Profilseite<\/p>\n<p>Die Eingabemaske f\u00fcr neue S\u00e4tze findet man bei &#8222;Mitmachen&#8220;. Von dort aus gelangt man auch auf Seite, die einem immer 5, 10 oder 15 zuf\u00e4llige S\u00e4tze zum \u00fcbersetzen pr\u00e4sentiert.<\/p>\n<p>Wer einen Fehler entdeckt, postet ihn als Kommentar. Deshalb sollte man von Zeit zu Zeit auf der Profilseite vorbeischauen und die Kommentare zu den eigenen Eintr\u00e4gen lesen. Eigene Kommentare kann man selber l\u00f6schen. Das finde ich sehr praktisch, weil ich am Anfang ein paar Mal eine \u00dcbersetzung in den Kommentar geschrieben hatte, statt in das \u00dcbersetzungsfeld.<\/p>\n<p>Was ein guter Tatoeba-Mitarbeiter beachten sollte, <a href=\"http:\/\/blog.tatoeba.org\/2010\/02\/how-to-be-good-contributor-in-tatoeba.html\">k\u00f6nnt ihr hier nachlesen<\/a>.<\/p>\n<p><strong>Lizenz<\/strong><\/p>\n<p>Die Datenbank steht unter der CC-BY (Fr) Lizenz und k\u00f6nnen also auch von anderen benutzt und <a href=\"http:\/\/tatoeba.org\/deu\/download_tatoeba_example_sentences\">heruntergeladen<\/a> werden. F\u00fcr Unterrichtszwecke ist das Online-Portal aber ohne Zweifel die einfachste L\u00f6sung.<\/p>\n<p><strong>Kommentar<\/strong><\/p>\n<p>Wie ihr aus der Einleitung ersehen k\u00f6nnt, finde ich das Projekt toll. Zwei kritische Anmerkungen m\u00f6chte ich dennoch machen. Die erste betreffen die Audio-Dateien. In Tatoeba besteht die M\u00f6glichkeit Audio zu integrieren, aber bisher gibt es noch kaum Audiodateien. Das liegt vor allem daran, dass die Audios nicht einfach so hochgeladen werden k\u00f6nnen, sondern ein ziemlich komplizierter Prozess eingehalten werden muss. Das dahintersteckende Streben nach Qualit\u00e4t verstehe ich zwar, aber die L\u00f6sung von <a href=\"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/2008\/07\/11\/forvo-all-the-words-in-the-world-pronounced\">Forvo<\/a>, Nutzer \u00fcber die Qualit\u00e4t abstimmen zu lassen, finde ich besser, weil das Mitmachen so niederschwelliger wird.<\/p>\n<p>Die zweite Anmerkung betrift die Art der enthaltenen Daten. Dass die W\u00f6rter Kontext durch einen Satz erhalten, ist super. Noch besser w\u00e4re es allerdings, wenn auch die S\u00e4tze Kontext h\u00e4tten. Die Interpretation eines Satzes &#8211; und damit seine \u00dcbersetzung &#8211;\u00a0 h\u00e4ngt oft vom Kontext ab. Abgemildert wird das allerdings durch die M\u00f6glichkeit, mehrere \u00dcbersetzungen f\u00fcr eine Satz einzugeben. Ein weiterer Stolperstein ist wieder mal das Urheberrecht, dass einen Grossteil der Texte von der Aufnahme ausschliesst. Soweit ich das verstehe, kann man auch keine Wikipediatexte integrieren, da die Lizenz der Wikipedia (CC-By-SA) strenger ist als die Lizenz von Tatoeba. Das f\u00fchrt dazu, dass sehr viele S\u00e4tze von den Benutzern ausgedacht werden und S\u00e4tze, von denen die Leute denken, dass sie sie sagen w\u00fcrden, sind nicht genau dasselbe wie S\u00e4tze, die sie tats\u00e4chlich produzieren. Die Richtlinien von Tatoeba f\u00fcr Beitr\u00e4ge sind aber vern\u00fcnftig und sollten zusammen mit einer grossen Zahl an Beitragenden zu einer guten Durchmischung f\u00fchren.<\/p>\n<p>Wie gesagt, ich empfehle euch wirklich, das Projekt anzusehen. Und Beitr\u00e4ge zu schreiben macht \u00fcberdies grossen Spass.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Am Wochenende habe ich mal wieder ein sch\u00f6nes neues Spielzeug entdeckt, und wie das so ist mit Spielzeugen, habe ich ziemlich viel Zeit damit vergeudet (aber f\u00fcr die Katz war es ganz und gar nicht).  Die Rede ist von Tatoeba, einem W\u00f6rterbuch (man k\u00f6nnte auch sagen einem Korpus) f\u00fcr ganze S\u00e4tze.<\/p>\n","protected":false},"author":24,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[5,11,4],"tags":[27,28,29,30,286,121,109,95,10,129,17],"_links":{"self":[{"href":"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/wp-json\/wp\/v2\/posts\/2134"}],"collection":[{"href":"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/wp-json\/wp\/v2\/users\/24"}],"replies":[{"embeddable":true,"href":"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/wp-json\/wp\/v2\/comments?post=2134"}],"version-history":[{"count":5,"href":"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/wp-json\/wp\/v2\/posts\/2134\/revisions"}],"predecessor-version":[{"id":2147,"href":"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/wp-json\/wp\/v2\/posts\/2134\/revisions\/2147"}],"wp:attachment":[{"href":"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/wp-json\/wp\/v2\/media?parent=2134"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/wp-json\/wp\/v2\/categories?post=2134"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/cornelia.siteware.ch\/blog\/wordpress\/wp-json\/wp\/v2\/tags?post=2134"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}