3D-Artikulatorische Sprachsynthese by Peter Birkholz

By Peter Birkholz

Diese Arbeit beschreibt ein artikulatorisches Sprachsynthesesystem, das in der Lage ist, synthetische Sprachausserungen in hoher Qualitat zu generieren. Das process umfasst ein Modell des Sprechapparats, ein aerodynamisch-akustisches Simulationsverfahren und ein Steuermodell fur die Generierung der artikulatorischen Bewegungsablaufe. Der Sprechapparat wird als ein verzweigtes Rohrsystem modelliert, das aus Abschnitten fur die Lunge und Luftrohre, die Stimmritze und den Rachen-, Mund- und Nasenraum zusammengesetzt ist. Dieses Rohrmodell bildet die Grundlage fur das aerodynamisch-akustische Simulationsverfahren, das gegenuber den meisten konventionellen Verfahren eine kontinuierliche Anderung der Rohrlange erlaubt und ein theoretisch basiertes Verfahren fur die Simulation von Friktionsrauschen einschliesst. Die Rohrgeometrie des Rachen- und Mundraums wird mit Hilfe eines dreidimensionalen geometrischen Modells des Vokaltrakts berechnet, das im Rahmen dieser Arbeit neu entwickelt wurde. Das Steuermodell basiert auf dem Konzept der artikulatorischen Geste und ermoglicht in einfacher Weise die Simulation koartikulatorischer Phanomene. Jede Ausserung wird als eine Abfolge von Gesten definiert und vom Steuermodell in die Zeitfunktionen der artikulatorischen Parameter uberfuhrt.

Show description

Read or Download 3D-Artikulatorische Sprachsynthese PDF

Similar german_1 books

Die Erfolgswirkung globaler Marken: Eine empirische Untersuchung unter Berücksichtigung kaufentscheidungsbezogener und individueller Einflussfaktoren

Stefanie Exler ermittelt anhand einer umfassenden empirischen Untersuchung die Effekte globaler Marken auf zentrale potenzialbezogene, konsumentenorientierte Erfolgsgrößen.

Extra info for 3D-Artikulatorische Sprachsynthese

Sample text

Mit dieser stückweise linearen Flächenfunktion A(x) werden im nächsten Schritt die Flächeninhalte Ai des diskreten Rohrmodells bestimmt. Wenn die Position und Länge der einzelnen Rohrabschnitte jeweils mit xi und li bezeichnet werden, so besteht die Aufgabe darin, die Funktionswerte von A(x) im Intervall [xi , xi + li ] jeweils auf einen einzelnen Wert Ai abzubilden. Die Berechnung von Ai als Mittelwert der Funktion A(x) in dem entsprechenden Intervall hat sich als nicht so günstig herausgestellt, wie ich ursprünglich vermutet habe.

5 werden in dieser Arbeit zusammen als „Anregungsparameter“ bezeichnet. Bei Syntheseexperimenten mit dem Glottismodell hat sich herausgestellt, dass die synthetische Stimme am natürlichsten klingt, wenn ζ01 und ζ02 gleich groß sind. Abhängig von der Wertebelegung von ζ01 und ζ02 kann eine gepresste, modale oder behauchte Stimme simuliert werden. Die drei Stimmregister liegen dabei auf einem Kontinuum zwischen kleinen und großen ζ-Werten. 3 mm geeignet. 4◦ gesetzt. Für eine höhere Natürlichkeit der synthetischen Stimme werden der vorgegebenen F0 -Kontur zusätzlich kleine quasi-zufällige Schwankungen ∆F0 (t) („Jitter“) nach einer Formel von Klatt & Klatt [60] überlagert.

Der Linienzug T0 T1 T2 T3 hat die Aufgabe, die Verbindung zwischen der Zungenspitze und dem Unterkiefer bzw. dem Mundboden herzustellen. 1 cm links unter T0 . 5 cm über dem tiefsten Punkt des Unterkiefers liegt. Wenn die Zungenspitze sehr tief liegt, dann wird der Punkt T1 so angepasst, dass er nicht unterhalb des Zungenbodens zu liegen kommt. In Tab. 2 ist für jeden der Zungenparameter der erlaubte Wertebereich als ein Intervall angegeben. Aufgrund der gegenseitigen Abhängigkeit der erlaubten Parameterwerte und der gekrümmten Form der oberen und unteren Hülle reichen die statischen Intervallgrenzen jedoch nicht aus.

Download PDF sample

Rated 4.00 of 5 – based on 28 votes