Linguistik online 4, 3/99


  Morpho-Phonologie der japanischen Verben:
Eine Optimality-Theory-Analyse der Assimilationsform

Jörg Fehr (Berlin)



 
 

Der folgende Aufsatz beschäftigt sich mit den morpho-phonologischen Problemen, die bei der Bildung der sog. Assimilationsform japanischer Verben (1) auftreten. Im Mittelpunkt stehen dabei die Bildungen mit velar-auslautenden Verbstämmen, die ein phonologisches Verhalten zeigen, das sich grundlegend von dem der übrigen konsonantenfinalen Stämme unterscheidet. Doch differieren die Velar-Stämme in diesem nicht nur im Vergleich zu den anderen Verbstämmen innerhalb der gleichen morphologischen Domäne, sondern auch in unterschiedlichen Wortbildungskontexten.

Es bietet sich daher an, dieses Phänomen als Testfall für die Beurteilung der Beschreibungsadäquatheit der Optimality Theory im Bereich der Morpho-Phonologie zu nutzen. Eine beschreibungsadäquate optimalitätstheoretische Analyse sollte ein einheitliches Ranking für alle relevanten Wortbildungskontexte liefern und darüber hinaus dem universalen Anspruch der Optimality Theory bezüglich der für die Analyse bemühten Beschränkungen gerecht werden.
 

1 Einführung

Die japanische Verbflexion wird agglutinativ gebildet, d.h. durch Affigierung voneinander segmentierbarer Funktionswörter, die zur Bezeichnung von Tempus, Aspekt, Modus, Genus Verbi und interpersonalem Bezug dienen. Die Funktionswörter sind morphologisch gesehen Suffixe, die die traditionelle japanische Grammatik unterschiedlichen Wortarten zuordnet. Zu nennen wären da vor allem Hilfsverben, Partikeln und Adjektive.

Der agglutinative Charakter der Flexion wird aber von der sogenannten Assimilationsform (jap. ombinkei) unterlaufen: Diese Flexionsform, an die die Dentalsuffixe -te (daher auch te-Form genannt), -ta, -tara und -tari angeschlossen werden, zeichnet sich durch einige morpho-phonologische Besonderheiten aus, die ihr einen, zumindest tendentiell stammflektierenden Charakter verleihen.

Im allgemeinen unterteilt man die japanischen Verben nach ihrem Verbstammauslaut in zwei Klassen: konsonantische und vokalische Verben. Bei der Suffigierung eines konsonantisch anlautenden Flexionsmorphems an einen konsonantischen Verbstamm, wird normalerweise ein Vokal zur Einhaltung der Silbenstrukturrestriktionen eingefügt (epenthetischer Vokal, Sproßvokal). Die traditionelle japanische Grammatik behandelt diese Stamm+Vokal-Konfigurationen als Stammformen; unterschiedliche Suffixe wählen beim Anschluß an konsonantische Verben jeweils unterschiedliche Stammformen, z.B.:(2)
 

Stammform Suffix Gramm. Funktion des Suffix
  Stamm Vokal    
Indefinitform jom- -a- -nai
-reru
-seru
Negation
Passiv
Kausativ
Konjunktionalform   -i- -masu
-tai
+Partik.
#
Interpersonaler Bezug (hörerbezogen)
Optativ
Nominalisierung
Koordinativ
Assimilationsform
(auch: te-Form)
    -te
-ta
-tara
-tari
Partizip
Präteritum
Konditional (real/hypoth.)
Alternativ
Final-/Attributivform   -u- #
+N
Präsens
Attributiv
Imperativform   -e- # Imperativ
Dubitativform   -o- -u (> o:) Dubitativ

Wie aus der Tabelle ersichtlich wird beim Anschluß der vier Dentalsuffixe -te, -ta, -tara und -tari jedoch kein Vokal zwischen Stamm und Flexionsmorphem eingefügt. Vielmehr treten Assimilations- bzw. Alternationserscheinungen auf, die den Stammauslaut verändern.

Im folgenden versuche ich, diese Phänomene unter optimalitätstheoretischen Gesichtspunkten zu analysieren und die damit verbundenen Probleme im Rahmen der Optimality Theory zu lösen.
Zuvor aber sollen überblicksartig die für die nachstehenden Analysen relevanten Grundprinzipien und Beschränkungsfamilien der Optimality Theory skizziert werden.
 

2 Grundriß der Optimality Theory

Die Optimality Theory (OT) stellt einen deklarativen Grammatikansatz dar: Die Regeln der Grammatik sind Outputfilter, im allgemeinen Wohlgeformtheitsbedingungen oder Beschränkungen (Constraints) genannt, die aus der unendlichen Menge von theoretisch möglichen Oberflächenstrukturen für eine zugrundeliegende Struktur diejenige herausfiltern, die die wenigsten Beschränkungen verletzt. Die OT unterscheidet sich u.a. von anderen beschränkungsbasierenden Ansätzen dadurch, daß ihre Beschränkungen explizit verletzbar (violable) sind. Nach der OT enthält die Universalgrammatik (UG) eine Menge von universalen, sehr allgemeinen und inhärent konfliktären Beschränkungen. Die Grammatik einer Sprache positioniert diese Beschränkungen in einer dominanzhierarchischen Rangfolge (Ranking), d.h., höherrangige Beschränkungen haben absolute Priorität vor niederrangigen. Verletzungen einer Beschränkung in wohlgeformten Strukturen treten nur dann auf, wenn sie die Verletzung einer höherrangigen Beschränkung verhindern. Sprachen unterscheiden sich prinzipiell in ihrem Ranking. Die Oberflächenformen einer gegebenen Sprache sind strukturelle Beschreibungen von Inputs, die optimal in folgendem Sinne sind: Sie erfüllen die universalen Beschränkungen oder, wenn diese Beschränkungen durch einen Input in Konflikt geraten, sie erfüllen so viele höchstrangige Beschränkungen wie möglich (cf. Tesar/Smolensky 1993: 1).

Eine OT-Grammatik besteht aus zwei Komponenten: GEN und H-EVAL. GEN erzeugt für eine gegebene zugrundeliegende Form (lexikalische Form, Input) eine potientiell unbeschränkte Menge möglicher Oberflächenstrukturen (Output), die Kandidatenmenge genannt wird. H-EVAL stellt eine Funktion dar, die aus dieser Kandidatenmenge die optimale(n) Oberflächenstruktur(en) herausfiltert.

GEN ist durch drei Prinzipien gekennzeichnet:

  1. Freedom of analysis
  2. Containment
  3. Consistency of exponence
Freedom of analysis besagt, daß die Funktion GEN in ihrer Strukturbildungskapazität unbeschränkt ist, d.h. sie kann bei der Konstruktion der Output-Kandidaten in einem beliebigen Ausmaß Strukturen zur Input-Form hinzufügen, was für eine adäquate Behandlung von epenthetischen Segmenten erforderlich ist. Das Containment-Prinzip verbietet es GEN, Elemente der Input-Strukturen bei der Derivation zu löschen. Oberflächenstrukturen enthalten also immer ihre lexikalischen (Input-)Strukturen als Teilstruktur.
Das Prinzip der Consistency of exponence wiederum verbietet GEN jegliche Änderungen an der zugrundeliegenden Spezifikation von Morphemen (cf. Gilberts/De Hoop 1998: 5).

Beschränkungen werden in der Optimality Theory zwei Typen zugeordnet: Markiertheitsbeschränkungen (markedness constraints) und Korrespondenzbeschränkungen (correspondence constraints). Markiertheitsbeschränkungen beurteilen oberflächenstrukturelle Elementtypen hinsichtlich ihres Verbreitungsgrades innerhalb der Menge der natürlichen Sprachen. Sind bestimmte Strukturen in jeder oder sehr vielen menschlichen Sprache aufzufinden (wie z.B. Silben mit konsonantischem Anlaut), so werden sie als unmarkiert betrachtet. Treten sie jedoch nur in einer kleinen Zahl von Sprachen auf, so besitzen derartige Elemente ofensichtlich einen besonderen Status und werden daher als markiert bezeichnet. Markiertheitsbeschränkungen filtern markierte Strukturen aus, präferieren also unmarkierte Strukturen.

Korrespondenzbeschränkungen evaluieren die Abbildungstreue zwischen Elementen verschiedener (lexikalischer Input - oberflächenstruktureller Output) oder gleicher struktureller Ebenen (Output - Output).

Beispiele für Markiertheitsbeschränkungen sind Silbenstrukturbeschränkungen wie Ons ("Jede Silbe hat ein Onset!") und *Coda ("Silben dürfen keine Coda haben!") oder Feature-Markiertheitsbeschränkungen (*Lab, *Dor, *Cor etc.). Sie sind im Gegensatz zu den Korrespondenzbeschränkungen reine Outputfilter, d.h. sie beschränken die Form des Outputs ohne Bezugnahme auf den zugrundeliegenden Input.

Korrespondenzbeschränkungen fallen im allgemeinen unter die folgenden Kategorien (cf. Gilberts/De Hoop 1998: 7f; McCarthy 1996: 3f):

Die ersten fünf Korrespondenzbeschränkungen beziehen sich auf die Zeichenketten-Ebene: Max verbietet das Löschen (Elision), Dep dagegen das Einfügen (Epenthese) von Elementen in korrespondierenden Zeichenketten, während Linearity Metathesen vorbeugt (cf. Gilberts/De Hoop 1998: 8). Uniformity untersagt die Verschmelzung von Input-Segmenten zu einem einzigen Segment im Output. Contiguity verhindert das Überspringen oder Verschieben von Elementen in einer Zeichenkette.

Die Beschränkungen aus der Ident(F)-Familieregieren dagegen Beziehungen zwischen Segmenten, indem sie Identität der internen Struktur (der "featural composition" (McCarthy 1996: 4)) von korrespondierenden Segmenten fordern und so Alternationen, Harmonie und Assimilationen unterbinden. Nach McCarthy (1996: 4) setzt Ident(F) segmentale Korrespondenz voraus, da Features selbst nicht in Korrespondenzbeziehung treten können.
 

3 OT-Analyse der Assimilationsform

Bei der Flexion der japanischen Verben mit Hilfe der Dentalsuffixe -te, -ta, -tara und -tari kommt es zur Bildung von Konsonantenclustern. Diese bestehen entweder aus einem Nasal in der Coda, gefolgt von einem homoorganischen, stimmhaften Obstruenten im Onset der folgenden Silbe (wie z.B. bei jon.da) oder aus einer stimmlosen Geminata (z.B. bei tot.ta). Die Bildung dieser Cluster wird im allgemeinen als Assimilationsphänomen klassifiziert (cf. Poser 1986; Itô/Mester 1986: 58f; Itô et al. 1995). Eine entsprechende Beschreibung, die darauf abhebt, daß der stammauslautende Konsonant und der silbenanlautende Plosiv des Suffixes bezüglich der Artikulationsstelle regressiv und hinsichtlich der Stimmhaftigkeit progressiv assimilieren, erweist sich aber in einigen Fällen als unzureichend. Man betrachte dazu beispielsweise /job+ta/ > /jon.da/, wo der stammauslautende Labial zu einem Nasal mutiert, /kaw+ta/ > /kat.ta/ bzw. /hair+ta/ > /hait.ta/, bei denen sich die inhärente Stimmhaftigkeit des stammauslautenden Sonoranten nicht auf den suffix-initialen Plosiv ausweitet, /kas+ta/ > /ka.si.ta/, wo die Assimilation offensichtlich blockiert wird, sowie /kak+ta/ > /kai.ta/ bzw. /kag+ta/ > /kai.da/, deren Velare nicht assimilieren, sondern durch den hohen vorderen Vokal ersetzt werden:
 

Verbparadigma (Tempus)
Stamm Präsens Präteritum  
mi mi.ru mi.ta 'sehen'
ta.be ta.be.ru ta.be.ta 'essen'
jom jo.mu jon.da 'lesen'
sin si.nu sin.da 'sterben'
job jo.bu jon.da 'rufen'
o.jog o.jo.gu o.joi.da 'schwimmen'
kak ka.ku kai.ta 'schreiben'
ha.nas ha.na.su ha.na.si.ta 'sprechen'
mat ma.tu mat.ta 'warten'
hair hai.ru hait.ta 'eintreten'
kaw ka.(w)u kat.ta 'kaufen'

Im Gegensatz zu den vokalisch auslautenden Verbstämmen lassen sich die konsonantisch auslautenden Verbstämme mit dem Dentalsuffix -ta (zur Bildung des Präteritums) nicht einfach durch eine Verkettungsoperation verbinden, da hierbei Konsonantencluster entstünden, die die japanische Phonotaktik nicht zuläßt. Es wird vielmehr der entsprechende Verbstamm so angepaßt, daß die resultierende Verbform die entsprechenden Silbenstrukturrestriktionen respektiert.
 

3.1 Markiertheitsbeschränkungen

Das Lexikon des Japanischen kann man in vier (McCawley 1968; Itô/Mester 1995) bzw. fünf (Fukazawa et al. 1998) Sublexika (Strata) unterteilen, die auf etymologischer Grundlage benannt sind und unterschiedliche phonologische Charakteristika besitzen. Für das morpho-phonologische Verhalten der japanischen Verben ist das native, sog. Yamato-Stratum zuständig. Lombardi (1998) identifiziert in diesem Zusammenhang die folgenden vier Beschränkungen:

  1. Coda Condition
  2. Postnasal Voicing
  3. No Voiced Geminates
  4. *rr/Nr
Die Coda Condition (CodaCond) besagt, daß nur solche Konsonanten in der Coda erlaubt sind, die hinsichtlich ihrer Artikulationsstelle (Place) mit dem Konsonaten des folgenden Onsets kongruieren (cf. Lombardi 1998: 2). Postnasal Voicing (PNV) läßt nur Nasal-Obstruenten-Folgen zu, bei denen der Obstruent stimmhaft ist, während No Voiced Geminates (NoVoicedGem) stimmhafte Obstruenten-Geminaten verbietet. Zusätzlich ist zu beachten, daß geminierte Liquide bzw. Nasal-Liquid-Sequenzen im Japanischen nicht zugelassen sind, was ich hier durch *rr/Nr formalisiere (cf. Lombardi 1998: 3).
 

3.2 Korrespondenzbeschränkungen

Die vorgenannten vier Markiertheitsbeschränkungen, die die Struktur japanischer geschlossener Silben restringieren, interagieren mit einer Reihe von Korrespondenzbeschränkungen, von denen aber für den Augenblick nur die folgenden relevant sind (cf. Lombardi 1998):

Die Relevanz dieser Korrespondenzbeschränkungen läßt sich aus dem Charakter der phonologischen Alternationen ableiten: Bei den stimmhaften, plosiv auslautenden Verbstämmen ist eine Übertragung der für die Plosive distinktiven [voice]-Spezifikation auf den Suffixanlaut festzustellen. Dies deutet auf eine dominierende obstruentenspezifische MaxVoice-Beschränkung hin (MaxVoiceObs). Die Verstimmhaftung des Suffixanlauts zieht gleichzeitig eine Verletzung von DepVoice nach sich, genauso wie die Nasalierung im Fall der Verbstämme mit bilabialem, stimmhaften Plosiv DepNas zuwiderläuft. Das Gelten von MaxOnsPlace ergibt sich aus der regressiven Richtung der totalen Assimilation bei den auf Sonoranten auslautenden Verbstämmen ebenso wie aus der gleichfalls regressiven Assimilationsrichtung bezüglich der Artikulationsstelle, was nebenbei bemerkt wiederum eine Verletzung der allgemeineren MaxPlace-Beschränkung impliziert.
Anders ausgedrückt: DepVoice und DepNas verhindern das Hinzufügen von [voice]- bzw. [nasal]-Features, MaxOnsPlace erhält die Distinktivität der Artikulationsstelle von Konsonanten in Onsetposition, MaxPlace die von [Place]-Spezifikationen allgemein. MaxOnsPlace ist gleichzeitig für die regressive Assimilationsrichtung verantwortlich. MaxVoiceObs schließlich sorgt dafür, daß die für Obstruenten distinktive [voice]-Spezifikation erhalten bleibt.(3)
 

3.3 Ranking

Nachdem im ersten Analyseschritt die für das zu behandelnde Phänomen relevanten Beschränkungen identifiziert und formalisiert worden sind, wird in einem zweiten Schritt der OT-Analyse das Ranking dieser Beschränkungen bestimmt. Betrachten wir die folgenden Beispiele:
 

Input Output-Kandidaten
Beschränkungen
    PNV CodaCond NoVoicedGem *rr/Nr
/sin+ta/          
  sidda     *  
  sinta *      
  sitta        
->
sinda        
  simba        
  simma        
  sinna        
/jom+ta/          
  jomta * *    
  jomda   *    
  jomba        
->
jonda        
  jotta        
  jodda     *  
  jonna        
  jomma        
/job+ta/          
  jobba     *  
  jobta   *    
  jotta        
  jodda     *  
->
jonda        
  jomma        
  jonna        
  jomba        
  jonta *      
/tor+ta/          
  torta   *    
->
totta        
  tonda        
  tomma        
  tonna        
  tomba        
  torra       *
  tomta * *    
  tonta *      

Jedes Sternsymbol in der Tabelle steht für jeweils eine Beschränkungsverletzung. Die Pfeile markieren die korrekte Oberflächenform, während der optimale Kandidatenoutput, der aus dem in der Tabelle dargestellten Ranking resultiert, durch den Fettdruck der Outputform signalisiert wird. Die Dominanzrelation zwischen Beschränkungen wird in den OT-Tabellendarstellungen durch die Reihenfolge der Spalten angezeigt.

Da die vier hier aufgeführten Silbenstrukturbeschränkungen unabhängig voneinander sind und demzufolge auch nicht miteinander konkurrieren, stehen sie in keiner Dominanzrelation zueinander (in den Tabellen üblicherweise durch gestrichelten Spaltenlinien signalisiert, hier aus technischen Gründen nicht darstellbar). Aus der Tabelle wird ersichtlich, daß es mehrere Output-Kandidaten pro Input gibt, die alle vier Silbenstrukturbedingungen erfüllen. Da aber jeweils nur eine Oberflächenform grammatisch ist, müssen noch andere Beschränkungen für die Auswahl relevant sein. Aufgrund der Tatsache, daß alle korrekten Oberflächenformen im Paradigma die obigen Silbenstrukturbeschränkungen respektieren, muß davon ausgegangen werden, daß diese Beschränkungen alle folgenden dominieren, zueinander aber in keiner dominanzhierarchischen Beziehung stehen.

Wie weiter oben bereits erwähnt sind bei der Bildung der Assimilationsformen im Japanischen neben den vier Silbenstrukturbeschränkungen auch die ebenfalls oben besprochenen fünf Korrespondenzbeschränkungen von Bedeutung:
 

    MaxOnsPlace MaxVoiceObs MaxPlace DepVoice DepNas
/jom+ta/            
->
jonda     * *  
  jomba *   * *  
  jotta     *    
  jomma *   *   *
  jonna     *   *
/sin+ta/            
->
sinda       *  
  simba *   ** *  
  sitta          
  simma *   **   *
  sinna         *
/job+ta/            
->
jonda     *   *
  jotta   * *    
  jomba *   *   *
  jomma * * *   **
  jonna   * *   **
(Als Kandidaten werden in der Tabelle nur solche aufgeführt, die die vier Silbenstrukturbeschränkungen respektieren.)

Wie aus der Tabelle ersichtlich, werden MaxOnsPlace und MaxVoiceObs von keiner der korrekten Oberflächenformen verletzt, so daß sie höher in der Rangfolge stehen müssen, als die restlichen Korrespondenzbeschränkungen. Gleichzeitig gibt es aber keine Evidenzen für ein relatives Ranking von MaxOnsPlace und MaxVoiceObs.

Filtert man die Kandidaten aus, die MaxOnsPlace und MaxVoiceObs verletzen, so ergibt sich folgendes Bild:
 

    MaxPlace DepVoice DepNas
/jom+ta/        
->
jonda * *  
  jotta *    
  jonna *   *
/sin+ta/        
->
sinda   *  
  sitta      
  sinna     *
/job+ta/        
->
jonda *   *

Es fällt auf, daß unter der dargestellten (zufälligen) Rankingannahme zwei der drei korrekten Oberflächenformen suboptimal sind. Daraus läßt sich schließen, daß dies nicht das korrekte Ranking sein kann. Eine Änderung des Rankings allein würde aber auch nicht das korrekte Ergebnis liefern, da die Form /sitta/, die keine der Beschränkungen verletzt, im Japanischen ungrammatisch ist. Offensichtlich muß also noch eine weitere Korrespondenzbeschränkung relevant sein. Die ungrammatischen Formen mit den geringsten Beschränkungsverletzungen unterscheiden sich von den grammatischen durch das Fehlen des stammauslautenden Nasals. Es liegt bei ihnen also eine Verletzung der MaxNas-Beschränkung vor:
 

    MaxPlace DepVoice DepNas MaxNas
/jom+ta/          
->
jonda * *    
  jotta *     *
  jonna *   *  
/sin+ta/          
->
sinda   *    
  sitta       *
  sinna     *  
/job+ta/          
-> 
jonda *   *  

Die Beispiele implizieren dann das folgende Ranking:

/jom+ta/ -> /jonda/: DepNas,MaxNas >> DepVoice >> MaxPlace,

/sin+ta/ -> /sinda/: DepNas, MaxNas >> DepVoice

/job+ta/ -> /jonda/: DepVoice, MaxNas >> MaxPlace, DepNas,

woraus folgt, daß MaxNas >> DepNas >> DepVoice >> MaxPlace:
 

    MaxNas DepNas DepVoice MaxPlace
/jom+ta/          
->
jonda     * *
  jotta *     *
  jonna   *   *
/sin+ta/          
->
sinda     *  
  sitta *      
  sinna   *    
/job+ta/          
->
jonda   *   *

Dieses Ergebnis wird auch durch weitere Beispiele im Verbparadigma bestätigt:
 

    MaxOnsPlace MaxVoiceObs MaxNas DepNas DepVoice MaxPlace
/tor+ta/              
->
totta            
  tonda       * *  
  tomma *     **   **
  tonna       **    
  tomba *     * * **
/kaw+ta/              
->
katta           *
  kanda       * * *
  kamma *     **   *
  kanna       **   *
  kamba *     * * *
/mat+ta/              
->
matta            
  manda       * *  
  manna       **    
  mamma *     **   **
  mamba *     * * **

Aus diesen Teilanalysen wird ersichtlich, daß die Silbenstrukturbeschränkungen im Yamato-Stratum unter allen Umständen eingehalten werden müssen. Um dies zu erreichen, werden die Place-Spezifikationen der stammauslautenden Konsonanten von den Place-Features des Suffix-Onsets überschrieben (vollständige regressive Assimilation). Verantwortlich dafür ist einerseits die CodaCond, die nur dann eine Coda zuläßt, wenn diese die Place-Spezifikation eines unmittelbar folgenden Onsets übernimmt; andererseits sorgt MaxOnsPlace dafür, daß die Place-Distinktion von Konsonanten in Onsetposition erhalten bleibt, was auch morphologisch von großer Bedeutung ist, da so die Segmentierbarkeit sowohl der verschiedenen Suffixe voneinander als auch der Suffixe vom Stamm sichergestellt ist, was den agglutinativen Charakter der japanischen Morphologie ausmacht.

Da nur bei den Plosiven und Frikativen/Affrikaten das Feature [voice] distinktiv ist (Nasale und Sonoranten sind inhärent stimmhaft), die Stimmhaft-stimmlos-Distinktion aber bei den Frikativen und Affrikaten im Verbalparadigma des modernen Japanisch nicht mehr vorhanden ist, tragen nur noch die Plosive die distinktive Last dieser Opposition, was das strikte Einhalten von MaxVoiceObs im phonologischen System des Japanischen erklärt. Zur Erhaltung einer [voice]-Spezifikation wird dann auch das Hinzufügen von [nasal] in Kauf genommen (d.h. also eine Verletzung von DepNas). Da PNV die Stimmhaftigkeit des folgenden Onsets nach einem Nasal verlangt, wird so das für Obstruenten distinktive [voice]-Feature in Form eines stimmhaften Suffix-Dentals gerettet, ohne eine Verletzung von NoVoicedGem zu riskieren.
Die Bewahrung bestimmter Feature-Spezifikationen vermutete übrigens schon Günther Wenck (1959: 107) als Ursache für die beschriebenen Lautveränderungen.

Eine ebenso herausragende Stellung wie das Feature [voice] bei Obstruenten haben offensichtlich auch die Nasale im Japanischen, die einer vollständigen Assimilation widerstehen, wie man am Beispiel /sin+ta/ sehen kann.
 

3.4 Die Problemfälle

Betrachten wir nun die auf einen velaren Plosiv bzw. alveolaren Frikativ auslautenden Stämme:
 

    CodaCond PNV NoVoicedGem *rr/Nr
/kak+ta/          
->
kaita        
/ojog+ta/          
->
ojoida        
/hanas+ta/          
->
hanasita        

Die korrekten Präteritumformen verletzen keine der vier Silbenstrukturbeschränkungen.
 

    NoCoda CmplxNuc
/kak+ta/      
->
kaita   *
/ojog+ta/      
->
ojoida   *
/hanas+ta/      
->
hanasita    

Allerdings ziehen die Diphthonge in den ersten beiden Formen eine Verletzung der Beschränkung gegen komplexe Silbenkerne CmplxNuc nach sich. Alle drei Formen halten die NoCoda-Beschränkung ein. Sowohl CmplxNuc als auch NoCoda haben aber im Japanischen eine sehr niedrige Priorität, so daß sie bei den vorangehenden Analysen nicht berücksichtigt werden mußten.
 

3.4.1 Frikativer Stammauslaut

Der stammfinale Frikativ /s/ unterliegt keiner Assimilation, was nach Lombardi (1998) auf das Feature [+strident] zurückzuführen ist: Alle anderen Konsonanten (mit Ausnahme der Velare) assimilieren hinsichtlich ihrer [Place]-Spezifikation; das Feature [+cont], das /s/ mit /r/ und /w/ teilt, kann für das abweichende Verhalten nicht verantwortlich sein, da /r/ und /w/ totaler Assimilation unterliegen. Daher muß bei [+strident] die Ursache für das Blockieren der Assimilation gesucht werden. Lombardi (1998: 13) geht daher von einer Max[+strident]-Beschränkung aus, die relativ höher gerankt sein muß als Dep[Seg], die durch das Einfügen des /i/-Segments verletzt wird.
 

    Max[+strident] Dep[Seg]
/hanas+ta/      
->
hanasita   *
  hanatta *  

 

3.4.2 Velarer Stammauslaut

Anders bei den velar-auslautenden Verbstämmen: Ihre Präteritumformen sind mit Dep[Seg] kompatibel. Im Gegensatz zu allen anderen stammauslautenden Obstruenten werden die Velare jedoch nicht vom folgenden Dental assimiliert, sondern es tritt regelmäßig der hohe Vokal /i/ an die Stelle der Velare.
Für eine synchrone Analyse dieser "Metamorphose" gibt es mehrere Alternativen, von denen jedoch keine das Problem adäquat erfassen kann. Eine naheliegende Möglichkeit ist die Beschreibung des Phänomens als "Vokalisierung" des velaren Plosivs (cf. Itô/Mester 1986:58). In diesem Fall würde man aber eher ein /a/ als ein /i/ anstelle des Velars erwarten, da /i/ keine velare, sondern eine palatale Artikulation besitzt.
Bei der Beschreibung der Assimilationsformbildung gingen wir davon aus, daß die Dentalsuffixe direkt an den Verbstamm angeschlossen werden. Diese Hypothese wird durch die auftretenden Assimilations- und Alternationsphänomene bestätigt, deren Auftreten nur als Strategie zur Vermeidung unzulässiger Konsonantencluster erklärt werden kann.
Bei allen anderen Verbformen befindet sich zwischen Stamm und Flexionsmorphem ein Vokal, der eine Clusterbildung verhindert. In diesen Fällen wird entweder eine Suffigierung an eine der fünf Stammformen angenommen (traditionelle japanische Grammatik), oder es wird eine der Suffigierung vorausgehende Vokalepenthese zwischen Stamm und Suffix vermutet (cf. McCawley 1968: 97). Letztere Variante wirft jedoch wieder andere Probleme auf: eine Analyse in diesem Stil muß fünf verschiedene epenthetische Vokale annehmen, deren Wahl noch dazu vom jeweiligen Suffix abhängig ist (4). Diese Wahl ist darüber hinaus nicht phonologisch bedingt, sondern rein morphologischer Natur. Eine andere Variante wäre die Annahme von Suffix-Allomorphen (jeweils ein Allomorph für konsonantische und vokalische Stämme). Auch dieser Ansatz bringt jedoch keine Lösung für das /i/-Problem bei der Assimilationsformbildung mit velarem Stammauslaut: es müßten nämlich speziell für die velaren und frikativen Stämme Dentalsuffix-Allomorphe mit /i/-Anlaut angenommen werden.
Geht man davon aus, daß die verschiedenen Suffixe unterschiedliche Stammformen als Basis der Affigierung fordern, eine Analysevariante, die von einigen Japanologen (z.B. Foljanty/Fukuzawa 1985; Lewin 1975: 106 Fußnote 6) und der trad. japanischen Grammatik favorisiert wird, so steht eine Erklärung des abweichenden Velar- und Frikativstammverhaltens aus. Weitere Verwirrung stiftet außerdem die Tatsache, daß es eine andere morphologische Umgebung gibt, in der das Auftreten von Velar-Plosiv-Clustern nicht zu einer Vokalisierung des Velars führt, sondern eine totale Assimilation des Velars mit dem nachfolgenden Plosiv stattfindet:
 

/fuki + tobas/
/hiki + tate/
/hiki + tsure/
/tsuki + dasu/
/tsuki + tatsu/
>
>
>
>
>
/fukitobasu, futtobu/
/hikitateru, hittateru/
/hikitsureru, hittsureru/
/tsukidasu, tsundasu/
/tsukitatsu, tsuttatsu/
'wegblasen'
'unterstützen'
'mitnehmen'
'ausstoßen'
'stecken'

Wie die Beispiele aus Poser (1986) verdeutlichen, gibt es neben den regulären Verbkompositaformen, die durch Verkettung einer Konjunktionalform (auf /i/ auslautende Stammform) mit einer Finalform entstanden sind, auch reduzierte Formen, die Konsonantencluster aufweisen. Beide Formtypen stehen in freier Variation zueinander, wobei die Reduktion allerdings als semi-produktiv anzusehen ist (cf. Poser 1986). Die Bildung der reduzierten Formen erfolgt bei allen Verbstämmen analog zur Suffigierung der Dentalsuffixe, mit Ausnahme der Stämme mit auslautendem Velar, der in diesem Fall wie alle anderen Obstruenten totaler Assimilation unterliegt, so daß
 

*fuitobu
*hiitateru
*hiitsureru
*tsuidasu
*tsuitatsu.
(cf. Poser 1986: 173)

Bei der nicht-reduzierten Komposition wird die erste Komponente, die in der auf /i/ endenden Konjunktionalform steht, mit einem weiteren Verb verkettet. Reduzierte Komposita werden dann durch Synkope des hohen Vokals an der Kompositionsfuge gebildet. Die dabei entstehenden Konsonantencluster unterliegen den bereits ausführlich diskutierten, im Yamato-Lexikonstratum unverletzlichen Silbenstrukturrestriktionen, was sich oberflächenstrukturell durch assimilierte Silbencodas bemerkbar macht. Poser (1986: 172) interpretiert diesen Bildungsprozeß der reduzierten Formen übrigens als Reduktion der Kompositagrenzen zu Morphemgrenzen. Ähnliches ließe sich aus sprachhistorischer Sicht auch für die Assimilationsform annehmen: Alle vier Suffixe lassen sich historisch auf einen gemeinsamen Ursprung zurückführen, nämlich auf das Verbalsuffix -tsu, mit dem im Klassischen Japanisch laut Lewin (1975: 166) der perfektive Aspekt ausgedrückt wurde. Nach Lewin (1975: 87) handelt es sich bei -te um die Konjunktionalform von -tsu, die durch Fusion mit dem Hilfverb der Befindlichkeit ari die Perfektform -tari (/te+ari/ > /tari/) im Klassischen Japanisch bildet, welche wiederum, infolge des Verlusts der Attributivform-Endung -ri und der ausschließlichen Perfekt-Bedeutung im Mitteljapanischen, zur Präteritumform -ta verkürzt wurde, dessen Indefinitform -tara schließlich im modernen Japanisch als Konditionalform dient (cf. Lewin 1975: 163f). So gesehen läßt sich vermuten, daß es sich beim Anschluß der Dentalsuffixe ursprünglich nicht um eine Derivation, sondern eher um eine Komposition handelte. Basis für den Anschluß der Suffixe war wie bei den reduzierten Komposita eine auf /i/ auslautende Verbstammform, die jedoch ihren vokalischen Auslaut verlor und so jene Konsonantencluster erzeugte, die die verschiedenen Assimilationen erst ermöglichten. Günther Wencks Analysen weisen ebenfalls in diese Richtung: er konstatiert in Wenck (1959: 103), daß die beschriebenen Lautveränderungen "grundsätzlich an der Nahtstelle enger Wortverbindungen" auftreten.

Sprachhistorisch kann man also die Herkunft des /i/ bei den Velar- und Frikativstämmen auf den vokalischen Auslaut der Konjunktionalform zurückführen. Synchron ist eine solche Bezugnahme auf die Konjunktionalform jedoch nicht möglich, da sich dann die Frage stellt, wie die /i/-Synkope, die man dann konsequenterweise bei allen nicht-velaren bzw. -frikativen Verbstämmen annehmen müßte, zu erklären ist.

Doch wie läßt sich die Vokalisierung der Velaren und die /i/-Epenthese nach Frikativen synchron im Rahmen der OT erklären? Ein Analyseversuch könnte wie folgt aussehen:

Die beiden hohen Vokale /i/ und /u/ könnte man als Default-Vokale des Japanischen betrachten. Beide wurden und werden zur Anpassung von Fremdwörtern an die native Silbenstruktur des Japanischen (d.h. zur Auflösung von im Japanischen nicht zugelassenen Konsonantenclustern) verwendet:
 

/arubaito/
/sutoraiku/
/sutoraiki/
/sutoretti/
'Ferienjob' (von dt. Arbeit)
'Strike' (beim Football)
'Streik'
'Stretch'

Das gilt auch für die einsilbigen, konsonantisch auslautenden Lehnwörter aus dem Chinesischen, die nach ihrer Übernahme in den japanischen Wortschatz "sämtlich vokalisch geöffnet [wurden]" (Lewin 1975: 20):
 

/betsu/
/niti/
/gaku/
/seki/
'verschieden'
'Sonne'
'Lernen'
'Stein'

Allerdings scheint in beiden Fällen die Verwendung von /u/ zu überwiegen.

/i/ und /u/ unterliegen im Standard-Japanischen der Devokalisierung (vor stimmlosen Konsonanten, vor /r/ und am Wortende) (cf. Rothaug 1991: 70f; Lewin 1975: 17). Daher kann man sie als unmarkiert betrachten, eine Analyse, die auch durch die Stellung von /u/ und /i/ in der (universalen) Sonoritätshierarchie gestützt wird: da die Zungenhöhe, nicht aber die Zungenlage bei der Sonoritätsbestimmung eine Rolle spielt, sind beide Vokale in dieser Hinsicht in gleichem Maße unmarkiert (cf. Golston 1995: 43).

Doch wie läßt sich dann die Präferenz für /i/ bei der Epenthese erklären?

Markiertheitsbeschränkungen könnten dafür verantwortlich sein: Vokale werden im allgemeinen mit dem Zungenrücken artikuliert, haben also eine dorsale Artikulation. Sie unterscheiden sich aber durch die Zungenhöhe ([high], [low]) und Zungenlage ([back]) sowie durch das Vorhandensein oder Fehlen von Lippenrundung ([round]). Letzteres ist für das Japanische irrelevant, da nicht-distinktiv.

Man könnte sich dann ein Ranking von drei Feature-Markiertheitsbeschränkungen *High, *Low und *Back vorstellen, vergleichbar dem der Place-Features *Lab, *Dors, *Cor und *Phar (cf. Lombardi 1997):
 

  *Low *Back *High
/i/     *
/u/   * *
/e/      
/o/   *  
/a/ *    

Ein Vorzug von /i/ und /u/ vor /a/ läßt sich nur durch ein Ranking *Low >> *Back, *High erreichen, folglich muß *High am unteren Ende der Dominanzhierarchie stehen und von *Back unmittelbar dominiert werden, da anderenfalls /o/ relativ unmarkiert im Vergleich zu /i/ und /u/ wäre. Doch gleichgültig welche Dominanzrelation zwischen diesen Beschränkungen angenommen wird, der unmarkierte Vokal wäre immer /e/, da er [-low, -high, -back] ist. Statt einer *Back-Beschränkung *Front anzunehmen, führt auch zu keiner befriedigenden Lösung, da dann /o/ aufgrund von [-low, -high, -front] den unmarkierten Vokal darstellen würde.

/e/ und /o/ sind aber hinsichtlich ihrer Sonorität stärker markiert als /i/ und /u/, so daß man eine Beschränkung MinSon (Minimale Sonorität) annehmen kann, die die Vokal-Feature-Beschränkungen dominiert:
 

Sonoritätshierarchie der Vokale
Hi: i,u
Mid: e,o
Low: a
(nach Golston 1995: 43)

 
  MinSon *Low *Back *High
/i/       *
/u/     * *
/e/ *      
/o/ *   *  
/a/ * *    

/i/ repräsentiert dann den unmarkierten Vokal des Japanischen.

Man muß aber anmerken, daß diese Analyse der relativen Preferenz des /u/ bei der Silbenstrukturanpassung von Fremd- und Lehnwörtern widerspricht. Da diese Präferenz jedoch andere Lexikonstrata betrifft als der hier behandelte Fall, könnte das Ranking der Beschränkungen *Back und *High in diesen Fällen umgekehrt sein.
 

Es ergibt sich dann unter Berücksichtigung aller relevanten Markiertheits- und Korrespondenzbeschränkungen für die frikativ- und velar-auslautenden Stämme folgendes (Teil-)Ranking:
 

    DepNas DepVoice Max[+strident] Dep[Seg] MaxPlace CmplxNuc *Back
/hanas+ta/                
->
hanasita       *      
  hanasuta       *     *
  hanatta     *        
  hanaita     *   * *  
  hanauta     *   * * *
/kak+ta/                
  kakita       *      
  katta         *    
->
kaita           *  
  kauta           * *
/ojog+ta/                
  ojogita       *      
->
ojoida           *  
  ojouta           * *
  ojonda *       *    

Dieses Ranking erklärt jedoch nicht das abweichende Verhalten der Velarstämme bei der Bildung reduzierter Komposita:
 

    DepNas DepVoice Max[+strident] Dep[Seg] MaxPlace CmplxNuc *Back
/hik+ta/                
  hikita       *      
  hitta         *    
->
hiita           *  
  hiuta           * *
/hik+tateru/                
  hikitateru       *      
->
hittateru         *    
hiitateru           *  
  hiutateru           * *
                 

Wie die Tabelle zeigt, wird bei diesem Ranking die ungrammatische Form /hiitateru/ statt der korrekten /hikitateru/ präferiert. Eine potentielle Erklärung für das unterschiedliche Wortbildungsverhalten der Velarstämme läßt sich folgendermaßen skizzieren: Anders als bei der Assimilationsform muß man bei der Verbkomposita-Bildung von einer anderen Inputform ausgehen. Anstatt des Verbstammes wird hier die Konjunktionalform als Input angenommen. Das Ranking bevorzugt dann die Form, die das zugrundeliegende /i/ der Konjunktionalform enthält.(5)
 

    MaxPlace DepSeg CmplxNuc
/hiki+tateru/        
->
hikitateru      
  hiitateru     *
  hittateru *    
/hik+ta/        
  hikita   *  
->
hiita     *
  hitta *    

Das dargestellte Ranking berücksichtigt jedoch nicht die optionale, reduzierte Kompositaform /hittateru/. Nimmt man für diesen Fall nun an, daß die Bildung nicht auf der Konjunktionalform, sondern auf dem Verbstamm basiert, was durch Posers (1986: 172) Grenzreduktionsthese durchaus gedeckt wäre, so ergibt sich dann wieder das Problem, daß die Form mit vokalisiertem /k/ aufgrund des Rankings, das wir bei der Assimilationsform ermittelt haben, der Form mit assimiliertem Coda-Konsonanten vorgezogen wird; eine Präferenz der (grammatischen) Form des reduzierten Kompositums würde jedoch das umgekehrte Ranking erfordern.

Offensichtlich läßt sich dieses Problem im Rahmen der OT nicht befriedigend lösen. Ich bezweifle, daß es sich überhaupt innerhalb einer rein synchronen Analyse adäquat beschreiben läßt.
Die Problematik zeigt deutlich die Grenzen, die einer synchronen Analyse, unabhängig vom jeweiligen theoretischen Rahmenkonzept gesetzt sind.
 

4 Ergebnis

Die Analyse hat gezeigt, daß der Entwicklungsstand der OT im Bereich der Phonologie weit fortgeschritten ist und ihrem universalen Anspruch dort gerecht wird. Dies gilt offenbar jedoch nicht in diesem Maße für die Behandlung morpho-phonologischer Phänomene. Soweit eine Reduzierung der Problematik auf die prosodische Ebene möglich ist, erzielt man mit einer OT-Analyse befriedigende Ergebnisse. Morphem- oder morphemklassenabhängige phonologische Alternationen entziehen sich jedoch einer adäquaten Beschreibung durch die OT, was auch die Ranking-Paradoxien zeigen, die infolge der Lexikonstratifizierung im Japanischen auftreten und deren Auflösungsansätze (cf. z.B. Fukazawa et al. 1998) zu einer nicht unerheblichen Komplexitätssteigerung dieser Theorie geführt haben.



Anmerkungen
(1) Die Analyse bezieht sich ausschließlich auf das Standardjapanische. Andere Varietäten des Japanischen zeigen bei der Assimilationsformbildung teilweise ein abweichendes Verhalten (cf. Martin 1988: 475ff).
(2) Die Transkription der Beispiele erfolgt nach IPA-SAMPA (cf. http://www.phon.ucl.ac.uk/home/sampa/home.htm).
(3) [voice] und [nasal] werden hier als monovalente Features angesehen.
(4) McCawley nimmt nur zwei epenthetische Vokale an: /a/ beim Anschluß des Negationsmorphems und /i/ beim Anschluß von -masu (Höflichkeit) sowie bei der Verbkomposition. Näheres cf. McCawley (1968: 95f).
(5) Ôno (1978: 200ff) vermutet, daß die Konjunktionalform im Proto-Japanischen durch Verschmelzen des Verbstammes mit einem Suffix -i entstanden ist, das im Altjapanischen zur Nominalisierung diente und formal ein Substantiv darstellt. Dies erklärt die auch im modernen Japanischen zu beobachtende Verwendung der Konjunktionalform als substantiviertes Verb.



Literaturverzeichnis

(ROA = Rutgers Optimality Archive: http://ruccs.rutgers.edu/roa.html)

Foljanty, Detlef / Fukuzawa, Hiroomi (1985): Japanisch intensiv II. Hamburg.

Fukazawa, Haruka et al. (1998): "Lexical Stratification and Ranking Invariance in Constraint-based Grammars." Erscheint in: Proceedings of the CLS 34. (ROA-267-0698).

Gilberts, Dicky / De Hoop, Helen (1998): "Conflicting constraints: An introduction to Optimality Theory." Lingua 104: 1-12.

Golston, Chris (1995): Direct OT: Representation as Pure Markedness. Ms. Heinrich Heine Univ. ROA 71-00002.

Itô, Junko / Mester, Armin (1986): "The phonology of voicing in Japanese." Linguistic Inquiry 17: 49-73.

Itô, Junko / Mester, Armin (1995): "Japanese Phonology." In: Goldsmith, John (ed.): The Handbook of Phonological Theory. Oxford: 817-838.

Itô, Junko et al. (1995): "Licensing and Underspecification in Optimality Theory." Linguistic Inquiry 26/4: 571-613.

Lewin, Bruno (1975): Abriß der japanischen Grammatik - auf der Grundlage der klassischen Schriftsprache. Wiesbaden.

Lombardi, Linda (1997): Coronal epenthesis and markedness. Ms. Univ. of Maryland, College Park. ROA-245-0298.

Lombardi, Linda (1998): Evidence for MaxFeature constraints from Japanese. Ms. Univ. of Maryland, College Park. ROA-247-0298.

Martin, Samuel E. (1988): A Reference Grammar of Japanese. Tokyo.

McCarthy, John J. (1996): Faithfulness in Prosodic Morphology & Phonology: Rotuman Revisited. Ms. Univ. of Massachusetts, Amherst. ROA-110-0000.

McCawley, James (1968): The Phonological Component of a Grammar of Japanese. The Hague.

Ôno, Susumu (1978): Nihongo no bumpo o kangaeru (Überlegungen zur japanischen Grammatik). Tôkyô.

Poser, William (1986): "Japanese Evidence Bearing on the Compensatory Lengthening Controversy." In: Wetzels, Leo / Sezer, Engin (eds.): Studies in Compensatory Lengthening. Dordrecht: 167-186.

Rothaug, Petra (1991): Abriß der japanischen Lautgeschichte. Hamburg.

Tesar, Bruce / Smolensky, Paul (1993): The Learnability of Optimality Theory: An Algorithm and Some Basic Complexity Results. Ms. University of Colorado at Boulder. ROA-2-0000.

Wenck, Günther (1959): "Zum sprachgeschichtlichen Begriff der onbin." In: Wenck, Günther: Pratum Japanisticum - Exemplifizierender Entwurf einer "Japanistik". Wiesbaden: 98-109.