Investigation and Modelling of Dynamical Facial Expression Perception

DSpace Repositorium (Manakin basiert)

Zur Kurzanzeige

dc.contributor.advisor Giese, Martin A. (Prof. Dr.)
dc.contributor.author Stettler, Michael
dc.date.accessioned 2025-06-30T11:59:22Z
dc.date.available 2025-06-30T11:59:22Z
dc.date.issued 2025-06-30
dc.identifier.uri http://hdl.handle.net/10900/167383
dc.identifier.uri http://nbn-resolving.org/urn:nbn:de:bsz:21-dspace-1673835 de_DE
dc.identifier.uri http://dx.doi.org/10.15496/publikation-108710
dc.description.abstract Gesichtsausdr¨ ucke spielen eine entscheidende Rolle in der sozialen Interaktion zwi- schen Menschen im t¨ aglichen Leben. Die menschliche Wahrnehmung ist dabei außer- gew ¨ ohnlich robust bei der Vearbeitung unbekannter Gesichter, und sogar gegen¨ uber nicht- menschlichen Kopfformen (z. B. Emojis, Cartoons). Der visuelle Mechanismus, der zur Wahrnehmung dynamischer Gesichtsausdr¨ ucke f¨ uhrt, ist weitgehend unklar. In die- ser Arbeit zielen wir darauf ab, zu verstehen, wie unser visuelles System dynamische Gesichtsausdr¨ ucke codiert. Unter Verwendung von Methoden aus der Computergrafik haben wir Stimuli entwickelt, um die menschliche Verhaltenswahrnehmung durch psy- chophysische Experimente zu untersuchen, und gleichzeitig elektrophysiologische Auf- zeichnungen von Rhesusaffen gesammelt. Wir nutzen diese Daten, um neue Modelle zu entwerfen, zu testen und zu validieren. In diesem Rahmen haben wir eine neuar- tige Architektur entwickelt, die auf der Normreferenzcodierung basiert. Diese wurde urspr ¨ unglich zur Modellierung von Gesichtsidentit¨ at vorgeschlagen und beruht auf der Annahme dass Gesichter als richtungsspezifische Abweichung eines Referenzgesichts repr ¨ asentiert sind. Zun¨ achst zeigen wir, dass die Normreferenzcodierung ein g¨ ultiger Mechanismus zur Codierung von Gesichtsausdr¨ ucken ist. Wir erweitern dann die Norm- referenzcodierung auf mehrere Referenzrahmen und erkennen, dass das Lernverfahren in diesem Fall in zwei Teile aufgeteilt werden kann. Diese Multi-Dom¨ anen- Normrefe- ¨ renzcodierung stellt einen dateneffizienten Mechanismus dar, der die Ubertragung von Gesichtsausdr¨ ucken ¨ uber grundlegend unterschiedliche Gesichtsformen mit nur einem Datenpunkt erm¨ oglicht. Wir erweitern unser Modell, um es auf gr¨ oßeren Datens¨ atzen zu testen, und zeigen, dass der Mechanismus auch dann robust ist und generalisiert. Schließ- lich stellen wir fest, dass die Normreferenzcodierung im Vergleich zu anderen Computer- ¨ Vision-Modellen eine gr¨ oßere Ahnlichkeit zur Wahrnehmung unserer menschlichen Pro- banden aufweist. Insgesamt beleuchtet unsere Arbeit einen in der Neurowissenschaft be- kannten Mechanismus,der jedoch bisher in der Computer Vision wenig erforscht wurde, und zeigt, wie er in diesem Kontext genutzt werden kann. Die Normreferenzcodierung hat das Potenzial, Computersysteme zu entwickeln, deren Wahrnehmung von Gesichts- ausdr¨ ucken der menschlichen Wahrnehmung ¨ ahnlicher ist als die aktueller Techniken. de_DE
dc.description.abstract Facial expressions play a crucial role in daily human social interactions. Humans exhibit a remarkably strong and innate ability to perceive both novel faces and non-human head shapes, such as emojis and cartoons. However, the visual mechanisms involved in per- ceiving dynamic facial expressions remain largely unclear. This thesis aims to unravel the processes by which our visual system encodes dynamic facial expressions. Employing computer graphics, we have crafted stimuli to delve into human behavioral perception through psychophysics experiments. Concurrently, we collect electrophysi- ological recordings from rhesus macaques. Leveraging these data sets, we design, test, and validate our models. Our innovative framework, based on norm-referenced encod- ing—a mechanism initially proposed for encoding facial identity—proves to be a valid mechanism for encoding facial expressions. Expanding norm-referenced encoding into multi-domain applications, we discover that utilizing an updatable reference frame allows us to split the learning procedure, mak- ing it a data-efficient mechanism. This enables the transfer of facial expressions across basic face shapes with only a single training data point. Extending our model to larger datasets, we demonstrate its robustness and generalization capabilities. Notably, norm- referenced encoding yields perceptual results closer to human perception compared to other computer vision models. In summary, our research sheds light on a mechanism well-known in neuroscience but relatively unexplored in computer vision. We demonstrate its potential application in developing computer systems that interact and understand human facial expressions more similarly to current techniques. Norm-referenced encoding holds promise for the advancement of computer systems in this domain. en
dc.language.iso en de_DE
dc.publisher Universität Tübingen de_DE
dc.rights cc_by de_DE
dc.rights ubt-podok de_DE
dc.rights.uri https://creativecommons.org/licenses/by/4.0/legalcode.de de_DE
dc.rights.uri https://creativecommons.org/licenses/by/4.0/legalcode.en en
dc.rights.uri http://tobias-lib.uni-tuebingen.de/doku/lic_mit_pod.php?la=de de_DE
dc.rights.uri http://tobias-lib.uni-tuebingen.de/doku/lic_mit_pod.php?la=en en
dc.subject.ddc 004 de_DE
dc.subject.other Dynamic Facial Expressions en
dc.subject.other Brain modelling en
dc.title Investigation and Modelling of Dynamical Facial Expression Perception en
dc.type PhDThesis de_DE
dcterms.dateAccepted 2025-03-14
utue.publikation.fachbereich Informatik de_DE
utue.publikation.fakultaet 7 Mathematisch-Naturwissenschaftliche Fakultät de_DE
utue.publikation.noppn yes de_DE

Dateien:

Das Dokument erscheint in:

Zur Kurzanzeige

cc_by Solange nicht anders angezeigt, wird die Lizenz wie folgt beschrieben: cc_by