izvor podataka: poirot

Računalni modeli za predviđanje i analizu ličnosti na temelju teksta

Computational Models for Text-Based Personality Prediction and Analysis


Ljudi se razlikuju u obrascima razmišljanja, osjećanja i ponašanja, što utječe na njihovu interakciju i prilagođavanje intrapsihičkom, fizičkom i društvenom okruženju. Pojedinačne i stabilne razlike proučava područje psihologije ličnosti. Mnoge razlike u ličnosti očituju se u jeziku i u načinu na koji se jezik koristi u društvenim interakcijama. To jezične podatke čini vrijednim izvorom podataka za istraživanje ličnosti, pogotovo u današnje vrijeme društvenih medija i velikih podataka, gdje na društvenim platformama nastaju ogromne količine teksta. Velike količine teksta, međutim, iziskuju računalni pristup analizi podataka temeljenoj na metodama obrade prirodnog jezika (NLP) i strojnom učenju. Tema ovog projekta jesu računalni modeli za analizu i predviđanje ličnosti iz teksta. Premda NLP i psihologija ličnosti imaju velik sinergijski potencijal, ova dva polja imaju različite ciljeve i vrijednosti, stoga su do sada u velikoj mjeri odvojena jedna od drugog. Ovaj se jaz može pripisati nedostatku odgovarajućih skupova podataka, interpretabilnih NLP modela koji modeliraju jezične pojave na razini diskursa te interdisciplinarnih vještina među istraživačima. Cilj ovoga projekta jest smanjiti taj jaz i postaviti osnove za istinski interdisciplinarno istraživanje u analizi ličnosti na temelju teksta. Projekt okuplja interdisciplinarni tim računalnih znanstvenika i psihologa ličnosti, s ciljem (1) izgradnje novih skupova podataka internetskog teksta i interakcije pogodnih za razvoj NLP modela i analizu ličnosti na temelju teksta, (2) razvijanja NLP modela za predviđanje i analizu ličnosti koji su inovativni, kreativni i učinkoviti, dok istovremeno osiguravaju valjanost i interpretabilnost te (3) provođenja niza konfirmatornih i eksploratornih studija analize podataka za otkrivanje povezanosti osobina ličnosti i jezičnih varijabli razgovora na internetu.

People differ in patterns of thinking, feeling, and behaving, which influences how they interact and adapt to the intrapsychic, physical, and social environments. The individual and stable differences are studied by the field of personality psychology. Many differences in personality get manifested in language and in the way language is used in social interactions. This makes language data a valuable source of data for personality research, especially in today’s era of social media and big data, with vast amounts of text generated on social media platforms. The large quantities of text, however, mandate a computational approach to data analysis, using methods from natural language processing (NLP) and machine learning. The topic of this project are computational models for personality analysis and prediction from text. Although NLP and personality psychology have a high potential for synergy, the two fields have different goals and values and thus far remain largely disconnected from each other. The gap can be attributed to the lack of adequate datasets, lack of interpretable NLP models that target discourse-level linguistic phenomena, and lack of interdisciplinary skill sets among the researchers. With this project, we aim to narrow this gap and set the ground for truly interdisciplinary research on text-based personality analysis. The project brings together an interdisciplinary team of computer scientists and personality psychologists, with the objectives to (1) compile novel datasets of online text and interaction suitable for the development of NLP models and text-based personality research, (2) develop NLP models for text-based personality prediction and analysis that are innovative, creative, and effective, but at the same warrant validity and interpretability, and (3) run a number of confirmatory and exploratory data analysis studies to investigate the links between personality traits and linguistic variables of online talk and interaction.


Obrada prirodnog jezika, strojno učenje, psihologija ličnosti, analiza teksta, jezik na internetu

Natural language processing, machine learning, personality psychology, text analysis, online talk

Znanstveno-istraživački projekti

psy.txt

IP-2020-02-8671

01.01.2021

31.12.2024

nije evidentirano

HRK 1.412.000,00