Gebruikershulpmiddelen

Site-hulpmiddelen


nl:taal:linked_chinees

Chinees is gewoon linked data

Linked data

De eerste stap die het Web tot het World Wide Web maakte was de hyperlink. Je kan in ieder stuk wat je schrijft verwijzingen zetten. Zo kan je verwijzen naar een plek waar de lezer meer kan lezen, je kan verwijzen naar een definitie van een term. De eerste stap was bedoeld om documenten te verbinden. Om een lezer verder te verwijzen naar achtergrondinformatie. Dat was de eerste stap. De volgende stap was data naar data laten verwijzen op een vergelijkbare manier om software toegang te geven tot al die kennis op het Web. Je legt dan een link van informatie naar andere informatie waarbij je aangeeft wat die link zelf betekent. Data wordt linked data. Je kan dan aangeven in welke eenheid een meetwaarde gegeven is, wat de definitie van die eenheid is. De definitie van die eenheid kan zelf weer verwijzen naar andere eenheden. En wanneer die informatie allemaal verbonden is kan je je meetwaarde omzetten naar verschillende eenheden.

Je informatie kan zo verbonden worden met alle andere informatie op het Web. Ieder informatieobject kan verbonden worden door een relatie met een ander object. Die relatie heet een predicate (engels voor gezegde). Je maakt zo korte zinnetjes: onderwerp - gezegde - lijdend voorwerp. Je hebt een standaardwoordenboek nodig van die gezegdes: een ontologie. Het concept is eenvoudig maar lastig echt te begrijpen. Het benadert informatie op een andere manier dan we in taal doen.

In taal beschrijven we een object met eigenschappen, de bijvoeglijke naamwoorden. In een rood hemd bijvoorbeeld is het feit dat rood de kleur van het hemd is impliciet. Het is een parameter van het hemd. Een manier om het op het Semantische Web te zeggen zou zijn: hemd heeft de kleur rood. Hierbij is heeft de kleur het predicate, het gezegde en rood is gewoon een ander object, net als het hemd. Onze taal werkt dus anders, maar dat geldt niet voor alle talen.

Linked Chinees

Het is een cliché dat in China relaties zo belangrijk zijn. In de taal zijn relaties in ieder geval zeker belangrijk. Chinees gebruikt geen bijvoeglijke naamwoorden zoals wij dat doen, werkwoorden worden niet verbogen maar staan gewoon werkwoord te zijn, en uiteraard wordt ieder woord uitgedrukt door een karakter. Dat karakter is de representatie van een object. Zoveel objecten als je in de werkelijkheid onderscheidt, zoveel karakters heb je nodig.

Die karakters hebben een relatie met andere karakters. Het voornoemde rode hemd is in chinees een 红色的衬衫. Hierin zijn 红 (rood, hóng) en 衬衫 (hemd, chènshān) objecten die verbonden worden door een predicate 色的, wat met heeft kleur vertaald kan worden. Dat predicate bestaat uit twee karakters 色 (kleur, se) en 的 (heeft, de) waarbij 的 de rol van allesverbinder heeft. Ik vertaal het hier met heeft maar eigenlijk valt dit altijd weg als het je het naar een westerse taal omzet. Een werkwoord als 是 (zijn, shi) moet je ook meer als een predicate dan als een werkwoord zien.

Het linked data aspect van chinees zie je vooral terug als je probeert een westerse taal naar chinees te vertalen. Waar we in nederlands en duits gebruik maken van bijzinnen om dingen nader te verklaren in een zin kan je dat in chinees gewoon niet doen. Een lange zin moet je vertalen in een reeks kleine zinnetje die allemaal het onderwerp-gezegd-lijdend voorwerp patroon volgen. Eigenlijk is chinees al linked data, met een eigen ontologie die zo om te zetten is naar een web ontologie.

nl/taal/linked_chinees.txt · Laatst gewijzigd: 2023/03/29 21:09 door 127.0.0.1