ESG ratings: waardevol of onbetrouwbaar?

22 september, 2022 auteur: Willem van der Meiden

For the English version, click here.

De afgelopen jaren is sustainability reporting steeds belangrijker geworden voor bedrijven. Het aantal bedrijven dat hun ESG informatie rapporteerde is gestegen van 20 in de jaren negentig naar 9000 in 2016 (Amir & Serafeim, 2017). Investeerders willen dat al deze informatie gemakkelijk toegankelijk is zodat zij deze kunnen gebruiken om beslissingen te maken. Om aan deze vraag te voldoen zijn verschillende raters begonnen met het uitdelen van ‘ESG scores’. Deze scores vatten het ESG rapport in een getal samen en geven zo aan hoe goed een bedrijf presteert op haar ESG doelen. Voorbeelden van raters zijn KLD, Sustainalytics, Moody’s ESG, S&P Global, Refinitiv en MSCI. Allemaal vooraanstaande en betrouwbare raters. Je zou verwachten dat al deze raters tot ongeveer dezelfde conclusie komen wanneer zij een bedrijf een ESG-score toekennen. Toch blijkt uit onderzoek dat de scores tussen de raters enorm kunnen verschillen. In dit artikel zoek ik uit waarom de raters het niet met elkaar eens zijn en of de ESG scores die zij toekennen dan nog wel waarde hebben.

Berg et al.

Uit onderzoek van (Berg et al., 2022)[1] blijkt dat de correlatie tussen de zes bovengenoemde raters verschilt tussen de 0.38 en 0.71, wat betekent dat ondanks dat de ratings in dezelfde richting lopen, ze niet altijd overeenkomen. Hierdoor is het moeilijk voor investeerders om waarde te hechten aan een bepaalde rating en is het voor bedrijven niet duidelijk welke aspecten zij moeten verbeteren om tot een hoge score te komen. De onderzoekers onderscheiden drie factoren die leiden tot deze verschillen. Kort samengevat komen deze drie factoren neer op het wat, hoe en hoe zwaar ze gaan beoordelen. Wat de raters gaan meten kunnen zij zelf bepalen. Waar de ene rater corruptie meeneemt in haar beoordeling, kiest de ander ervoor arbeidsvoorwaarden te meten en te beoordelen. Vervolgens kan hoe zij dit gaan meten ook nog verschillen. Zo kan de ene rater kiezen arbeidsvoorwaarden te beoordelen op basis van een tevredenheidsscores van werknemers, terwijl de ander kiest het aantal rechtszaken aangespannen door werknemers tegen de werkgever te gebruiken. Hoe zwaar de raters oordelen kunnen zij zelf bepalen. Als twee raters allebei corruptie en arbeidsvoorwaarden beoordelen, kan de ene een groter gewicht toekennen aan corruptie terwijl de ander arbeidsvoorwaarden belangrijk vindt. Hierdoor kan de rating verschillen, zelfs als de raters precies dezelfde variabelen meenemen. De onderzoekers spreken over 709 indicatoren in 64 categorieën. Uit deze stapel kiezen raters zelf welke indicatoren ze hoe zwaar meewegen en is het dus logisch dat er verschillen ontstaan.

Research Affiliates

De verschillen die ontstaan kunnen groot zijn. Een onderzoek van Research Affiliates [2] laat een goed voorbeeld zien: Wells Fargo. Deze Amerikaanse bank wordt door de ene rater in de laagste 5% op het gebied van governance geplaatst, terwijl de andere rater de bank in de hoogste 25% plaatst. Dit komt omdat de een een schandaal in de Governance pilaar plaatst, terwijl de ander vindt dat dit onder de Social pilaar valt. Het schandaal betrof het op grote schaal aanvragen van nieuwe rekeningen en creditcards voor klanten, zonder dat zij hiervoor toestemming gaven. De kosten die bij deze rekeningen en creditcards hoorde werden wel in rekening gebracht.

“Zij kunnen namelijk niet een willekeurige rating pakken.”

De resultaten staan in star contrast met ratings voor non-ESG attributes zoals langetermijnschuld. Raters S&P, Moody’s en Fitch tonen op dit gebied correlaties tussen 0.94 en 0.96, wat aangeeft dat de ratings heel erg overeenkomen. De reden? Aan ratings over financiële informatie zijn veel meer eisen en richtlijnen verbonden dan voor ESG ratings. Bovendien zijn de aantallen en bedragen vaak goed meetbaar. Het is makkelijk een eenduidig antwoord te geven op het totaalbedrag aan uitstaande schuld, dan op hoe tevreden werknemers zijn.

Investeerders

Dat ESG ratings onderling zoveel verschillen heeft gevolgen voor investeerders[3]: zij kunnen namelijk niet een willekeurige rating pakken en op basis daarvan een beslissing maken om wel of niet te investeren. De investeerder moet aanvullend onderzoek doen naar hoe de rater scores berekend en of de factoren die de rater gebruikt overeenkomen met de factoren die de rater belangrijk vind. Als dit het geval is, kan de investeerder deze scores gebruiken. De verschillen op zich kunnen de rater ook informatie geven. Uit onderzoek van Gibson en Krueger [4] blijkt namelijk dat hoe groter het verschil in ratings, hoe hoger de returns voor dat bedrijf.

Toekomst

Om ratings beter op elkaar aan te laten sluiten zullen enkele afspraken gemaakt moeten worden over het wat, hoe en hoe zwaar. Accenture [5] noemt vijf aanbevelingen om de ratings dichter bij elkaar te brengen. Zo zouden raters transparanter kunnen zijn over hoe zij tot hun rating zijn gekomen. Ook kunnen regulators concreet aangeven welke factoren onder E, S en G vallen, zodat alle raters dezelfde factoren onder dezelfde noemer scharen. Voor de bedrijven die hun ESG informatie publiceren is ook een taak weggelegd: standaardisatie. Dit houdt in dat de data die zij aanleveren via hun ESG report consistent is en voldoet aan wereldwijde richtlijnen zoals voorgeschreven door de International Sustainability Standards Board. Op deze manier leveren alle bedrijven dezelfde soort informatie aan bij de raters, waardoor er minder kans is dat zij deze op verschillende manieren interpreteren.