Hoe het internet weet of je gelukkig of verdrietig bent

blij of verdrietig 5 28

Denk na over wat je vandaag met Facebook hebt gedeeld op Facebook. Was het een gevoel van "stress" of "falen", of misschien "vreugde", "liefde" of "opwinding"? Telkens wanneer we op sociale media posten, laten we sporen achter van onze stemming. The Conversation

Onze emoties zijn waardevolle goederen en veel bedrijven ontwikkelen geautomatiseerde hulpmiddelen om ze te herkennen in een proces dat sentimentanalyse wordt genoemd.

Onlangs een gelekt rapport onthuld dat Facebook kan identificeren wanneer jonge mensen zich kwetsbaar voelen, hoewel het bedrijf dat wel heeft stond erop dat het de analyse niet heeft gebruikt om gebruikers met advertenties te targeten. Facebook verontschuldigde zich ook in 2014 voor een experiment over 'emotionele besmetting' waarbij berichten met 'positief' of 'negatief' sentiment uit de feeds van gebruikers werden gefilterd.

Het is duidelijk dat het vermogen om emotie uit tekst te detecteren van groot belang is voor zowel sociale-mediabedrijven als adverteerders. Maar hoe werkt sentimentanalyse, waarom is het nuttig en wat zijn de gevaren?

Hoe werkt sentimentanalyse?

Hoewel de details van het eigen algoritme van Facebook niet publiek bekend zijn, vallen de meeste technieken voor sentimentanalyse in twee categorieën: onder toezicht of zonder toezicht.

Bewaakte methoden zijn gebaseerd op gelabelde gegevens. Met andere woorden, dit zijn berichten die handmatig zijn geclassificeerd als positieve of negatieve sentimenten bevatten.

Statistische methoden worden vervolgens gebruikt om modellen te trainen om nieuwe berichten automatisch te classificeren op basis van de aanwezigheid van vooraf geïdentificeerde woorden of zinsdelen, bijvoorbeeld "benadrukt" of "ontspannen".

Niet-gesuperviseerde methoden daarentegen zijn vaak afhankelijk van het bouwen van een woordenboek met scores voor verschillende woorden. Een dergelijk woordenboek ontwikkeld door mijn medewerkers vroegen mensen om een ​​1 te geven aan de 9-geluksscore voor verschillende woorden, en vervolgens het gemiddelde te nemen: "regenbogen" scoorden bijvoorbeeld 8.06, terwijl "nutteloos" 2.52 kreeg.

Het algemene sentiment van een zin kan dan worden gescoord door naar alle woorden in de post te kijken. Bijvoorbeeld, de gemiddelde score voor de post "Mijn moeder altijd zei: 'het leven is als een doos bonbons'" is volgens dit woordenboek een bovengemiddeld 6.02, wat suggereert dat het een positief gevoel uitdrukt.

Waar wordt sentimentanalyse voor gebruikt?

Sentimentanalyse wordt in toenemende mate gebruikt door marketeers om onderzoek trends en maak productaanbevelingen.

Stel je voor dat een nieuwe mobiele telefoon wordt uitgebracht; een sentimentanalyse van posts op sociale media over de telefoon kan een bedrijf waardevolle, realtime inzicht geven in hoe het presteert.

Er zijn bredere toepassingen van sentimentanalyse. Onderzoekers hebben onlangs volgde het Twittersentiment van Donald Trump tijdens de eerste 100-dagen van zijn presidentschap en ingebouwde bots om markttransacties te plaatsen wanneer hij positief of negatief over specifieke bedrijven tweets.

Wetenschappers kunnen ook emotionele trends in andere teksten volgen. We hebben bijvoorbeeld sentimentanalyse gebruikt om de emotionele kanten van meer dan 1,000-films te bestuderen via hun scenario's. De boog van de 2013 Disney-film Frozen wordt hieronder getoond.

privacy Emotionele boog voor de film Frozen.

Veel films laten soortgelijke patronen zien: regelmatige pieken en dalen van spanning en ontlading, gevolgd door een bijzonder groot aantal 80% van de weg door de film (alle hoop is verloren!), Vóór de uiteindelijke resolutie en het gelukkige einde. Een soortgelijke analyse op romans toepassen, hebben we aangetoond de meeste verhalen volgen een van de zes basisbogen.

We zijn nog steeds niet zo goed in sentimentanalyse

Aangezien sentimentanalyse vaak gebaseerd is op mijnbouwposten op sociale media, roept dit belangrijke ethische bezwaren op, en dit debat is nog maar het begin. Maar de complexe aard van taal en betekenis maakt het vatbaar voor fouten.

Neem de zin "Moge de kracht bij je zijn", die 5.35 scoort met behulp van de analyse van ons woordenboek. Voor elke Star Wars-fan is het natuurlijk een enorm positieve uitdrukking, maar het scoort bescheiden in onze test omdat het woord 'force' een ondergemiddelde 4.0 scoort.

Dit is begrijpelijk wanneer dit woord afzonderlijk wordt beoordeeld, maar in de context is het minder logisch.

Enige scepsis over de geldigheid van de sentimentanalysemogelijkheden van Facebook is daarom gerechtvaardigd. Het is volledig denkbaar dat het beschrijven van iets als "volledig ziek" op Facebook, een uitdrukking van informele goedkeuring, ertoe kan leiden dat de emotionele toestand van een individu verkeerd wordt geclassificeerd.

Om te begrijpen wanneer sentimentanalyse wel of niet werkt, is het belangrijk om de woorden te onderzoeken die bepaalde resultaten opleveren.

Om dit te doen gebruiken we "woordverschuiving"Diagrammen, zoals die hieronder voor Frozen. Dit laat zien welke woorden de climax van het scenario treuriger maakten dan het gelukkige einde: meer verwijzingen naar "droefheid" en "angst", maar vreemd, meer "mooi".

privacy Maak een vergelijking tussen het hoogtepunt van Frozen en zijn happy end. De blauwe balken in de richting van de bovenkant van de grafiek geven de belangrijkste bijdragende woorden aan het verschil in score.

Belofte en een waarschuwing

Sentimentanalyse is een krachtig hulpmiddel, maar het is maar een jonge wetenschap en moet met de nodige voorzichtigheid worden gebruikt.

Wetenschappers moeten tools ontwikkelen waarmee we 'onder de motorkap' kunnen kijken en begrijpen waarom bepaalde algoritmen de resultaten produceren die ze doen. Dit is de enige manier om problemen met verschillende methoden te diagnosticeren en, nog belangrijker, om het publiek voor te lichten over de mogelijkheden en beperkingen van het veld.

Sentimentanalysesonderzoek is grotendeels gebouwd op grote, openbare datasets, met name van sociale media. Het is belangrijk dat degenen onder ons onbewust de gegevens verstrekken om te begrijpen waarvoor en waarvoor ze niet kunnen worden gebruikt.

Over de auteur

Lewis Mitchell, docent toegepaste wiskunde, Universiteit van Adelaide. Michelle Edwards heeft bijgedragen aan dit artikel.

Dit artikel is oorspronkelijk gepubliceerd op The Conversation. Lees de originele artikel.

Related Books:

{amazonWS: searchindex = Books; keywords = internet privacy; maxresults = 3}

enafarzh-CNzh-TWnltlfifrdehiiditjakomsnofaptruessvtrvi

volg InnerSelf op

facebook-icontwitter-iconrss-icoon

Ontvang de nieuwste via e-mail

{Emailcloak = off}