Self-locating beliefs vs loss of discriminating power

sleeping beauty

In Adam Elga’s 2000 paper “Self-locating belief and the Sleeping Beauty problem”, he opens with:

In addition to being uncertain about what the world is like, one can also be uncertain about one’s own spatial or temporal location in the world. My aim is to pose a problem arising from the interaction between these two sorts of uncertainty, solve the problem, and draw two lessons from the solution.

His answer to the sleeping beauty problem is 1/3. But this violates conditionalisation and reflection. His diagnosis is that this has to do with the self-locating nature of the beliefs:

The answer is that you have gone from a situation in which you count your own temporal location as irrelevant to the truth of H, to one in which you count your own temporal location as relevant to the truth of H. […] [W]hen you are awakened on Monday, you count your current temporal location as relevant to the truth of H: your credence in H, conditional on its being Monday, is 1/ 2, but your credence in H, conditional on its being Tuesday, is 0. On Monday, your unconditional credence in H differs from 1/ 2 because it is a weighted average of these two conditional credences — that is, a weighted average of 1/2 and 0.

But Arntzenius (2003) shows that the problem has nothing to do with the self-locating nature of the beliefs and everything to do with the loss of discriminating power of experiences.

Strict conditionalization of one’s degrees of belief upon proposition X can be pictured in the following manner. One’s degrees of belief are a function on the set of possibilities that one entertains. Since this function satisfies the axioms of probability theory it is normalized: it integrates (over all possibilities) to one. Conditionalizing such a function on proposition X then amounts to the following: the function is set to zero over those possibilities that are inconsistent with X, while the remaining nonzero part of the function is boosted (by the same factor) everywhere so that it integrates to one once again. Thus, without being too rigorous about it, it is clear that conditionalization can only serve to “narrow down” one’s degree of belief distribution (one really learns by conditionalization). In particular a degree of belief distribution that becomes more “spread out” as time passes cannot be developing by conditionalization, and a degree of belief distribution that exactly retains its shape, but is shifted as a whole over the space of possibilities, cannot be developing by conditionalization.

So we need to distinguish problems with spreading from problems with shifting.

shifting

Self-locating beliefs undergo shifting in a perfeclty straightforward manner which has nothing to do with sleeping beauty type cases:

suppose that one is constantly looking at a clock one knows to be perfect. […] At any given moment one’s degrees of belief […] will be entirely concentrated on one temporal location, namely, the one that corresponds to the clock reading that one is then seeing. And that of course means that the location where one’s degree of belief distribution is concentrated is constantly moving.

spreading

Beliefs can undergo spreading when the situation is such that there is a loss of discriminating power of experiences over time. In Shangri-La1,

there are two distinct possible experiential paths that end up in the same experiential state. That is to say, the traveler’s experiences earlier on determine whether possibility A is the case (Path by the Mountain), or whether possibility B is the case (Path by the Ocean). But because of the memory replacement that occurs if possibility B is the case, those different experiential paths merge into the same experience, so that that experience is not sufficient to tell which path was taken. Our traveler therefore has an unfortunate loss of information, due to the loss of the discriminating power of his experience.

The same thing is happening in sleeping beauty, contra Elga:

In the case of Sleeping Beauty, the possibility of memory erasure ensures that the self-locating degrees of belief of Sleeping Beauty, even on Monday when she has suffered no memory erasure, become spread out over two days.

It just so happened that Elga chose an example in which self-locating beliefs are “counted as relevant to the truth of H”. This caused confusion.

implication for bayesianism

The lesson from Arntzenius (2003) is that conditionalisation, understood as ereasing and re-normalising, is not a necessary condition of ratioanlity.

It’s a mistake to think of bayesian rationality as conditionalisation. The key maxim, that implied by Bayes’ theorem, is: ‘At each time, apportion your credences to your evidence’.

We can think of this as having an ‘original’ or ‘ur-prior’ credence distribution. At each time, you should update that ur-prior based on your total evidence E. E can come to contain less information, (you “lose evidence”) in cases of fogetting or loss of discriminating power. When you lose evidence, your credence distribution undergoes spreading.

constraints on ur-priors?

What norms constrain the ur-priors of rational agents? One possibility is the following. Think of possible worlds. Within each possible world, there are many experience-moments: one for each observer location and each time. When one is uncertain about about one’s own spatial or temporal location, one is uncertain about which experience-moment one finds oneself in within a possible world.

So one set of possible constraints are:

  • In accordance with the principal principle, your credence in each possible world should be equal to the objective chance of that world.
  • In accordance with a principle of indifference, your should apportion your credence in a world equally between all its possible experience-moments.
  1. “Every now and then, the guardians to Shangri La will allow a mere mortal to enter that hallowed ground. You have been chosen because you are a fan of the Los Angeles Clippers. But there is an ancient law about entry into Shangri La: you are only allowed to enter, if, once you have entered, you no longer know by what path you entered. Together with the guardians, you have devised a plan that satisfies this law. There are two paths to Shangri La, the Path by the Mountains, and the Path by the Sea. A fair coin will be tossed by the guardians to determine which path you will take: if heads you go by the Mountains, if tails you go by the Sea. If you go by the Mountains, nothing strange will happen: while traveling you will see the glorious Mountains, and even after you enter Shangri La, you will forever retain your memories of that Magnificent Journey. If you go by the Sea, you will revel in the Beauty of the Misty Ocean. But, just as you enter Shangri La, your memory of this Beauteous Journey will be erased and be replaced by a memory of the Journey by the Mountains. Suppose that in fact you travel by the Mountains. How will your degrees of belief develop? Before you set out your degree of belief in heads will be 1/2. Then, as you travel along the Mountains and you gaze upon them, your degree of belief in heads will be one. But then, once you have arrived, you will revert to having degree of belief 1/2 in heads. For you will know that you would have had the memories that you have either way, and hence you know that the only relevant information that you have is that the coin was fair. This seems a bizarre development of degrees of belief. For as you are traveling along the Mountains, you know that your degree of belief in heads is going to go down from one to 1/2. You do not have the least inclination to trust those future degrees of belief. Those future degrees of belief will not arise because you will acquire any evidence, at least not in any straightforward sense of “acquiring evidence.” Nonetheless, you think you will behave in a fully rational manner when you acquire those future degrees of belief. Moreover, you know that the development of your memories will be completely normal. It is only because something strange would have happened to your memories had the coin landed tails that you are compelled to change your degree of belief to 1/2 when that counterfactual possibility would have occurred.” 

June 13, 2017

Comment un individu peut-il faire une différence? Une mauvaise réponse, et deux bonnes

J’entends souvent des dialogues de ce genre quand il s’agit de faire un effort personnel pour aider les autres:

Alice: Face à toute la souffrance dans le monde, je me sens impuissante. Même si je changeais mon comportement, mon action individuelle ne résoudrait pas nos problèmes. Par exemple, même si je faisais un don pour aider un agriculteur pauvre au Kenya, d’autres ne donneront rien, et ce n’est pas grâce à moi que nous allons éliminer la pauvreté. Ce n’est pas à moi, mais aux puissants de ce monde d’agir.

Bernard: Si tout le monde raisonnait comme toi, nous ne ferions jamais rien pour aider les plus vulnérables. Au contraire, si chacun agit à son niveau, nous pouvons éliminer la pauvreté ensemble. Ainsi, en prenant partie à une action sociale, chacun peut changer les choses. Tu n’es donc pas impuissante.

Alice et Bernard font tous deux erreur. Nous ne sommes pas impuissants à être solidaires, mais ce n’est pas pour les raisons avancées bar Bernard.

Nous sommes tous des individus

J’ai de la sympathie pour la point de vue de Bernard. Alice doit avoir tort, car porter son raisonnement à sa conclusions aurait pour conséquence qu’il faudrait arrêter de travailler à tous les grands problèmes de l’humanité. Mais la réponse de Bernard est fallacieuse.

Nous sommes tous des individus. Je ne suis pas une société, vous n’êtes pas un état, aucun d’entre nous n’est un groupe ou une institution. Les actions dont nous pouvons décider sont des actions individuelles. Bien sûr, des individus peuvent influencer ces groupes, mais encore une fois, le choix de cette influence est finalement individuel. C’est le choix de voter, de se rendre à la réunion communale, ou d’aller manifester. La réplique “si tous agissent à leur niveau…” n’est pas opérante car personne ne peut décider si tous agissent ou non. Nous pouvons seulement décider d’agir nous-mêmes, ou de tenter de convaincre d’autres d’agir.

Distinguer deux objections

Afin d’expliquer pourquoi Alice a réellement tort, il faut distinguer deux objections différentes qui pourraient se cacher derrière ce discours.

Rapellons-nous la phrase d’Alice:

Même si je changeais mon comportement, mon action individuelle ne résoudrait pas nos problèmes.

Une première interprétation de cette phrase est la suivante:

Les petits changements ne vont pas résoudre les grands problèmes : une victime de la pauvreté de moins ne vas pas affecter le développement économique d’un pays pauvre; un végétarien ne va pas mettre fin à l’élevage industriel.

A ce premier type d’objection il y a une réponse simple et correcte. Ceux qui objectent de cette façon utilisent implicitement une fraction de ce type :

\[\frac{\text{Impact individuel}}{\text{taille du problème}}\]

Par exemple, faire un don à une ONG luttant contre l’extrême pauvreté au Kenya est intuitivement rattaché au problème de la pauvreté dans le monde. Devenir végétarien correspond au but de mettre fin à l’élevage industriel. Dans ces deux cas, le dénominateur de la fraction est très grand : votre impact individuel ne représente qu’une partie infime du problème que vous souhaitez résoudre. Mais il est fallacieux d’utiliser cette fraction. Pour décider si une action en vaut la peine, il faut comparer ses bénéfices à ses coûts, et non pas à la taille d’un autre problème. Si vous souhaitez maximiser votre impact positif, c’est simplement le numérateur qu’il faut maximiser. Le dénominateur est sans conséquence. L’habitant du village Kenyan souhaite seulement atteindre une vie meilleure, le niveau de la pauvreté mondiale lui importe peu. La poule élevée en batterie souhaite seulement échapper à sa vie de souffrance, quoi qu’il arrive à la production mondiale de viande[1]. La question qu’il faut plutôt vous poser est quelle serait la manière de les aider le plus possible.

Un semblant de paradoxe

Ce dont je souhaite en réalité parler ici est la seconde interprétation de l’objection d’Alice, plus sophistiquée. Au lieu d’avancer que votre impact personnel est très petit par rapport à une autre grandeur, l’argument est cette fois bien que l’effet de votre action individuelle est nul.

Imaginons qu’Alice ne fasse le discours suivant: “Réfléchis à ce qui se déroule réellemet lorsque tu agis à une échelle individuelle. Quand tu décides de ne pas acheter de viande au supermarché, le paquet que tu laisses sur l’étagère est composé d’animaux qui sont déjà morts. Ce n’est donc pas eux que tu aides. Mais tu raisonnes ainsi: “si je n’achète pas de viande, le supermarché s’ajustera à cette réduction de demande en commandant moins de viande, ce qui finira par réduire l’offre de viande et ainsi le nombre d’animaux en élevage”. Mais ce raisonnement n’est pas correct. Les décisions du supermarché ne dépendent pas de ton choix. Le supermarché réduira sa demande de viande uniquement s’il observe une réduction importante de la consommation, par exemple 2% de son inventaire. Ta réduction individuelle sera trop petite pour affecter le choix du supermarché. Les gérants ne remarqueront même pas ton choix, masqué par les variations aléatoires de la consommation de viande.

De même, regardons comment fonctionne l’ONG. Elle opère actuellement des écoles dans 5 villages. Pour établir une école dans un sixième village, il lui faut 100 000€ par an de dons supplémentaires pour payer les enseignants. Si elle n’en recoit que 99 999€, elle ne pourra pas les payer, et conservera l’argent dans son compte en banque. À moins que l’ONG ne soit déjà à 90 000€ ou plus, un don de 10 000€ n’aura donc aucun impact.

Un troisième exemple: imaginons qu’un tremblement de terre ne frappe le Népal. Une ONG népalaise organise en urgence l’achat de matériel médical à une entreprise pharmaceutique Indienne. Pour des raisons logistiques, l’entreprise ne vend le matériel qu’en incréments de 100 000€. Comme pour l’école dans le village Kenyan, il est très improbable que votre don soit celui qui permet tout juste à l’ONG d’acheter un incrément de plus.”

Alice a raison d’observer que la grande majorité des petits dons ou un petits changements de comportement n’ont aucun impact. Pourtant, un petit nombre d’entre eux ont un impact demesuré. Par exemple, le donateur marginal qui fait passer l’ONG de 99 999€ à 100 000€ donne lieu à la construction d’une école avec un seul euro!

Fonction en escalier Une fonction en escalier. Ici, certains mouvements vers la droite le long de l’axe des abcisses (les dons \(y\)) n’ont aucun effet sur l’impact \(u\) de l’organisation, alors que certains très petits mouvements ont un grand impact en passant d’un palier à un autre.

Il faudrait donc, en théorie, tout faire pour être le donateur marginal, ou le consommateur qui s’abstient d’acheter l’unique portion de viande qui ferait basculer la décision du supermarché.

La solution du paradoxe se trouve dans le fait qu’un ciblage si précis est impossible en pratique. Dans les exemples simpifiés ci-dessus, il faudrait connaitre en détail la situation financière des ONG ou l’inventaire du supermarché, et de plus prédire le comportement de tous les autres donateurs et conommateurs. De surcroît, en réalité les procédures de décision qu’appliquent ces institutions sont bien plus complexes que je ne l’ai fait paraître. Il faudrait prendre en compte toute la chaîne de production de la viande, ou encore toutes les opportunités et contraintes auxquelles fait face l’ONG.

Plusieurs fonctions en escalier

En réalité, nous sommes ignorants quant à laquelle d’un grand nombre de fonctions en escalier correspondent à la réalité. En moyennant ces fonctions, nous arrivons à nouveau à une fonction linéaire.

Nous sommes donc totalement ignorants quant à l’identité du donateur marginal. Nous conaissons seulement la probabilité d’être au point de bascule, par exemple 10% avec un don de 10 000€ et des incréments de 100 000€. Il serait possible de réduire notre incertitude quant à l’identité du point de bascule, par exemple en construisant une modéalisation mathématique extrêmement complexe de la chaine de production de la viande. Mais en pratique cette procédure serait bien plus couteuse que le don lui-même.

Alice oublie de mettre en balance cette probablité de succès avec la taille du bénéfice potentiel. Autrement dit, si la probabilité de succès est \(p\) et la taille du bénéfice \(u\), la quantité qui nous intéresse est l’espérance mathématique \(pu\). Alice comment l’erreur de ne considérer que \(p\). En général, dans ce type de cas, \(p\) est très petit mais \(u\) est très grand, et ce de manière proportionelle. Par exemple, si \(p=10%\), \(u=\text{une école}\), alors \(pu\) correspond à un dixième de la valeur d’une école: exactement le même ratio que celui entre la taille du don (10 000€) et le cout d’une école (100 000€).

  1. Une autre manière de voir cet argument est d’observer que la valeur du dénominateur est de toute façon arbitraire. Il catégorise votre action comme visant à résoudre un problème dont les limites sont arbitrairement choisies. Le don contre la pauvreté pourrait aussi bien être rattaché au but de rendre les plus heureux les habitants du village ou agit l’ONG. Le choix de devenir végétarien pourrait être reformulé comme visant à aider les poules de votre région plutôt que tous les animaux d’élevage industriel dans le monde. La fraction est alors plusieurs milliers de fois plus grande, mais il n’y a aucune raison de préférer un dénominateur à l’autre. 

June 12, 2017

A better formalism for interpreting confidence intervals

When we take a sample mean, we should think of it as a random variable, and our measured sample mean as a realisation of that random variable. The sample mean is a random variable because it is the result of random sampling. Repeated sampling involves observing repeated realisations of the random variable.

We should think of confidence intervals around this mean as realisations of a random interval, an interval whose bounds are random variables rather than real numbers. This is an attractive formalism because it resolves many confusions around the interpretation of confidence intervals.

Suppose the true population mean is the number \(Y\). The mean of a random sample from this population is the random variable \(\bar{y}\). Then the random interval

\[[ \bar{y} - 1.96 se(\bar{y}) , \bar{y} + 1.96 se(\bar{y}) ]\]

has an approximately 95% probability of containing \(Y\).

Suppose in our sample \(\bar{y}\) takes the realisation \(1230\) and \(se(\bar{y})\) takes the realisation \(5.4\). So an instance of the above random interval is the confidence interval:

\[[ 1230 - 1.96 * 5.4 , 1230 + 1.96 * 5.4 ]\]

The confidence interval either contains or does not contain \(Y\).

In full, my proposed interpretation schema is:

\([ 1230 - 1.96 * 5.4 , 1230 + 1.96 * 5.4 ]\),

is a realisation of

\([ \bar{y} - 1.96 se(\bar{y}) , \bar{y} + 1.96 se(\bar{y}) ]\),

and the probability

\(P( Y \in[ \bar{y} - 1.96 se(\bar{y}) , \bar{y} + 1.96 se(\bar{y}) ]) = 0.95\).

This formalism has several advantages:

  • robustness: distinguishing random intervals from confidence intervals means it’s much harder to get confused into making an incorrect probabilistic statement about the non-probabilistic object \(Y\).
  • parsiomy: we express everything we want using only probabilities, random variables, and intervals, three well-understood notions.
  • relevance: our interpretation only involves the objects we actually have (a random interval and a confidence interval). We need not make reference to (hypothetical) repeated sampling.

The ugly and the bad

Unfortunately, my preferred formalism does not appear to be popular. Let me show some of the alternatives I have seen and explain their downsides and how my proposal does better.

1

Oxford department of statistics:

The interval is random, not the parameter. Thus, we talk of the probability of the interval containing the parameter, not the probability of the parameter lying in the interval.

This is the worst example, and is admittedly rarely seen in print. But in speech I’ve seen it used often, even by academics who were trying to explain the correct interpretation of confidence intervals! The problem with this of course is that once you write it down in mathematical language, the probability of the interval containing the parameter is exactly the same object as the probability of the parameter lying in the interval. In our example it is simply \(P(Y \in [ 1230 - 1.96 * 5.4 , 1230 + 1.96 * 5.4 ])\). It is equal to 1 or 0.

2

Quantitative Economics lecture notes for Oxford undergraduates:

“Were this procedure to be repeated on multiple samples, the calculated confidence interval (which would differ for each sample) would encompass the true population parameter 95% of the time.”

I don’t like this because:

  • It invokes the clunky counterfactual “were this procedure to be repeated”. What if it’s impossible to take repeated samples? We still want to be able to make statements about our confidence interval.
  • It doesn’t have a clear mathematical formalisation. how do I write “95% of the time” in terms of probabilities?
  • The actual confidence interval we have is nowhere mentioned. For what is supposed to be an interpretation of that object, that’s a little confusing.

My formalism solves these three problems.

3

Wikipedia:

“There is a 90% probability that the calculated confidence interval from some future experiment encompasses the true value of the population parameter.”

Similar complaint here: why do we need to refer to future experiments? We want an interpretation of the confidence interval we actually have.

4

Harvard University:

For this reason, for a 95% CI, we say that we have 95% confidence that the interval will cover the true population mean. We use the term ‘confidence’ instead of probability because although the sample mean is random, the single interval we calculate is fixed. We also cannot talk about the probability that the population mean will lie within a certain interval, since it is also fixed.

This needlessly introduces the new concept of ‘confidence’, which is bound to cause confusion. It’s much better to use probabilities, a concept we already understand and for which we have a formal notation.

June 10, 2017

Consistent Vegetarianism and the Suffering of Wild Animals - Journal of Practical Ethics

A revised version of the essay I wrote for the Uehiro Prize has been published in the Journal of Practical Ethics.

Abstract:

Ethical consequentialist vegetarians believe that farmed animals have lives that are worse than non-existence. In this paper, I sketch out an argument that wild animals have worse lives than farmed animals, and that consistent vegetarians should therefore reduce the number of wild animals as a top priority. I consider objections to the argument, and discuss which courses of action are open to those who accept the argument.
May 25, 2017

Qu'est-ce que l'altruisme efficace ?

Evénement de lancement de l’association Altruisme Efficace France, à Paris le 5 juillet 2016

Qu’est-ce que l’altruisme efficace ?

Quelles sont les meilleures façons d’aider les autres ? Bien entendu, cette question fait débat. Y répondre avec sérieux requiert des prises de positions morales, et des recherches empiriques approfondies. Les désaccords sont inévitables, et ils sont légitimes. Mais ce n’est pas pour autant qu’une affaire d’opinion. L’altruisme efficace est basé sur l’idée que toutes les manières d’aider les autres ne se valent pas.

Cette volonté de dépasser le domaine de l’opinion est tout à fait compatible avec une appréciation de la difficulté de la tâche et de l’incertitude de nos hypothèses. Une analogie avec la science pourrait être utile ici. Dans les sciences naturelles, les chercheurs sont souvent en désaccord. Cependant, malgré cette diversité de points de vue, il y a aussi beaucoup de consensus : il est démontré que certaines propositions sont incorrectes. Et au fur et à mesure que la communauté scientifique continue de récolter plus de données et de les analyser de manière critique, elle rejette les mauvaises théories, affine ses hypothèses, et progresse.

C’est ainsi que nous concevons l’altruisme efficace - une tentative de répondre à une question difficile, à laquelle nous pourrons apporter des réponses de plus en plus précises à mesure que nous y investissons plus d’effort. L’altruisme efficace, c’est avant tout cette question, et un engagement à tenter d’y répondre de manière rationnelle et scientifiquement argumentée. Ainsi, l’altruisme efficace est une démarche qu’il convient de séparer des conclusions particulières auxquelles l’on peut arriver en la suivant.

Enfin, l’altruisme efficace n’est pas qu’une analyse académique. Nous souhaitons identifier la meilleure manière d’aider, puis passer à l’action en la mettant en oeuvre.

Comment trouver une cause efficace ?

Parmi tous les moyens d’aider les autres, comment trouver celui qui permettrait d’avoir le plus grand impact ? Nous tentons de répondre à cette question en suivant certains principes fondateurs.

Faire le meilleur usage de nos ressources

Nos ressources sont limitées. Quelle que soit notre générosité, il est impossible de résoudre immédiatement tous les problèmes constatés dans le monde. Notre situation est similaire à celle d’un médecin en zone de guerre : il y a des centaines de blessés, mais le personnel médical est limité. Il met alors en place un système de triage médical, qui assigne un degré de priorité à chaque blessé, dans le but de sauver le maximum de victimes. De même, nous avons chacun une quantité limitée de temps et d’argent, et nous ne pouvons pas aider toutes les victimes de souffrances dans le monde. La meilleure chose à faire est alors de se concentrer sur les actions qui aideront le plus possible, celles qui auront le plus grand impact par euro donné ou heure investie.

Empathie Globale

Prendre en considération toute vie consciente, sans exclusion liée à l’appartenance à un groupe donné, qu’il soit fondé sur la nationalité, l’ethnie, la croyance ou l’espèce..

Dans un des textes majeurs de la philosophie morale contemporaine, Famine, Affluence and Morality[1], Peter Singer nous invite à étendre notre cercle d’empathie au-delà de notre propre pays et à reconnaître qu’une vie vaut la même chose, qu’elle soit vécue dans un pays développé ou un pays en développement. Nous souhaitons aider ceux auxquels il est possible d’apporter le plus grand bénéfice, et s’il s’agit d’habitants des pays en développement au lieu de nos compatriotes, c’est cela qu’il faut préférer. La plupart des personnes engagées dans l’altruisme efficace étendent ce raisonnement jusqu’à son aboutissement logique, qui est de prendre en considération les vies non-humaines ainsi que les vies futures de ceux qui ne sont pas encore nés. Certains se concentrent donc sur la souffrance des animaux d’élevage ou tentent d’améliorer la trajectoire future de l’humanité à très long terme.

Ouverture d'esprit et "agnosticisme de cause"

Considérer toutes les causes et actions possibles, puis agir de la manière qui produit le plus grand impact positif.

Il est habituel de commencer par choisir une cause pour des raisons personnelles ou émotionnelles, puis de se demander quelle serait l’action la plus efficace au sein de cette cause. (“Je souhaite soutenir la recherche contre le cancer car mon père est mort d’une tumeur cérébrale. Quel est le meilleur organisme de recherche contre le cancer ?”) Mais dans l’altruisme efficace, le choix de la cause lui-même fait l’objet d’une recherche rationnelle, car les plus grandes différences d’efficacité se trouvent entre différentes causes et non au sein d’une cause. Il s’agit donc de partir d’une position “agnostique à la cause” afin de pouvoir choisir la plus efficace parmi toutes les causes possibles, et de pouvoir changer de cause en réaction à de nouvelles informations.

Se concentrer sur l'action la plus efficace

Le choix optimal est probablement 10 ou 100 fois supérieur à la moyenne.

La taille chez les humains suit une distribution normale : les plus grands humains ont une taille au plus 60% supérieure à la moyenne. Par contre, le classement de popularité des sites web suit une loi de distribution très asymétrique (loi de puissance) : Google, le site le plus populaire, reçoit des milliards de visiteurs, alors que la vaste majorité des sites sont très peu visionnés. Certains éléments de preuve suggèrent que les actions altruistes suivent, comme la popularité des sites web, une distribution très asymétrique. En utilisant la base de données DCP2, le philosophe Toby Ord a montré que dans le domaine de la santé, le rapport coût-efficacité de différentes interventions suit une distribution extrême : l’intervention la plus efficace produit 15 000 fois plus de bénéfice que la moins efficace, et 60 fois plus que l’intervention médiane[2]. Au-delà de la base DCP2, les interventions de santé les plus efficaces sont particulièrement exceptionnelles : l’éradication de la variole en 1979 a prévenu plus de 100 millions de morts, pour un coût de 400 millions de dollars.

Ainsi, il apparaît probable que la meilleure action possible soit non pas 30% plus efficace ou 3 fois plus efficace, mais bien 10, 100 ou même 1000 fois plus efficace que la moyenne. Il est donc essentiel de concentrer nos ressources non pas seulement sur une action très efficace, mais sur celle qui est la plus efficace. Cela ne veut pas dire que tous ceux qui agissent selon ce principe doivent forcément travailler au service de la même cause. Il existe bien sûr des incertitudes considérables et des différences de valeurs, qui amènent différentes personnes à choisir des projets différents.

Privilégier les causes indûment négligées par d'autres

Pour déterminer l’impact d’une action, il faut appliquer un raisonnement à la marge : quel est l’effet supplémentaire de l’effort que j’apporte ? Il ne suffit pas d’observer l’effet moyen d’une action, il faut considérer son effet marginal. Imaginez que le grenier d’un village ne prenne feu. Les villageois ont le temps de sauver des flammes quelques réserves de nourriture avant que le feu n’engloutisse tout le bâtiment. Le plus important est de sauver le blé qui permettra de survivre l’hiver. Pourtant, si tous les autres villageois se concentrent sur les sacs de blé, ils réussiront à en sortir assez. Plutôt que de prendre encore plus de blé, votre meilleure action altruiste serait de sortir le sac de sel. Dans cet exemple, le sel a plus de valeur à la marge, malgré le fait qu’en moyenne le blé soit essentiel à la survie. De même, si l’on investit dans une cause négligée, le bénéfice marginal de chaque action sera supérieur, car les meilleures opportunités d’aider les autres n’auront pas encore été exploitées. Au contraire, il sera plus difficile d’avoir un grand impact dans une cause qui reçoit déjà beaucoup de ressources. Par exemple, apporter des vaccinations de base à ceux qui en ont besoin est extrêmement efficace : de nombreux cas de maladies graves peuvent être évités à faible coût. Mais soutenir ces vaccinations n’est généralement pas conseillé pour un donateur individuel, car les besoins les plus essentiels sont déjà couverts par les gouvernements ou les grandes fondations.[3] Si par contre une cause est négligée, cela peut donc constituer un indice en sa faveur.

Prendre en compte ce qui adviendrait si vous n'agissiez pas

Il ne suffit pas de considérer les effets directs de votre action, il faut prendre en compte son effet contra-factuel, c’est à dire la différence entre les conséquences réalisées suite à votre action et les conséquences qui seraient advenues si vous n’aviez pas agi. Imaginez que quelqu’un subisse un arrêt cardiaque devant vous. Vous venez de recevoir un entraînement de secourisme, et vous avez tant de zèle à aider que vous poussez de côté le médecin qui s’apprêtait à s’occuper de la victime. Vous parvenez à réanimer la victime, mais vous n’avez pas pour autant sauvé sa vie. Si vous n’étiez pas intervenu, le médecin l’aurait fait. Votre action était donc remplaçable, elle n’a pas eu d’impact contra-factuel. Ce raisonnement est essentiel pour évaluer rigoureusement nos actions altruistes : par exemple, devenir enseignant bénévolement dans une école d’un pays en développement pourrait avoir un impact négatif au lieu de positif, si le bénévole prenait la place d’un enseignant local expérimenté qui aurait fait un meilleur travail.

Mettre en balance la probabilité de succès avec la taille du bénéfice

La plupart de nos actions n’apportent pas un bénéfice garanti, mais augmentent la probabilité qu’un certain bénéfice advienne. Par exemple, militer contre les conditions de l’élevage intensif n’a aucune garantie de modifier le comportement des éleveurs ou d’inciter un gouvernement à légiférer, mais rend ces éventualités plus probables. Il est tout aussi fallacieux de choisir des objectifs très importants sans penser à la probabilité de les atteindre, que de rejeter toutes les actions à faible probabilité de succès sans prendre en compte la taille de ce succès potentiel. Il s’agit plutôt d’estimer l’espérance mathématique de notre action, en multipliant la probabilité des succès par la valeur du succès. On peut donc être amené à soutenir des actions qui garantissent un succès modeste, comme un don à une ONG distribuant des moustiquaires, ou des actions qui ont une faible probabilité de produire des bénéfices exceptionnels, telles que la recherche scientifique ou l’action politique.

Nos hypothèses : quelques exemples de causes efficaces

Appliquer ces principes de manière rigoureuse et pragmatique n’a rien d’automatique ni de simple. C’est pour cela que l’altruisme efficace est indissociable d’une réflexion critique sans cesse renouvelée. Cependant, les causes suivantes apparaissent prometteuses :

  • Lutter contre les problèmes de santé de base dans les pays en développement.[4] Environ 10 millions de personnes meurent chaque année à cause de maladies dont la prévention est simple, telle que la diarrhée, le paludisme, ou la tuberculose. Ces maladies ne tuent pratiquement personne dans les pays riches. Il est clairement possible d'améliorer significativement la santé dans les pays en développement, avec des interventions à faible coût dont l'efficacité est prouvée. Par exemple, distribuer des moustiquaires imprégnées d’insecticide en Afrique Sub-Saharienne permet d'empêcher un enfant de mourir du paludisme pour un coût de moins de 3 000 $[5]. Améliorer la santé crée aussi des opportunités économiques[6]: la maladie ralentit le développement des enfants, augmente fortement l'absentéisme scolaire, et les empêche de réaliser leur potentiel.
  • Aider les animaux victimes de l'élevage.[7] Chaque année environ 100 milliards d'animaux sont élevés pour que des humains les mangent : 15 par personne en moyenne[8]. L'écrasante majorité des experts en neurologie animale estiment que les cochons, vaches et poules sont capables de ressentir la souffrance d'une manière similaire aux humains. Malheureusement, ces animaux sont en grande majorité élevés dans des conditions de forte souffrance. Dans les élevages industriels, les poules ont le bec coupé sans anesthésie et sont confinées à de minuscules cages. Les truies mettent bas dans des cages où elles ne peuvent effectuer aucun mouvement, et en France les cochons sont castrés à vif. Parmi les personnes qui travaillent sur cette cause, certains tentent de développer des alternatives aux produits animaux, de convaincre d'autres de devenir végétariens ou véganes, ou d'influencer la réglementation de l’élevage et de l’abattage.
  • Contrôler les risques d'échelle mondiale.[9] De nombreux événements pourraient être catastrophiques pour la terre entière : une guerre mondiale, une nouvelle pandémie, le changement climatique, ou des nouvelles technologies à haut risque. Malheureusement, ces risques sont le problème de tous à la fois et la responsabilité de personne en particulier, et sont donc souvent négligés. Pourtant, une telle catastrophe pourrait non seulement causer beaucoup de souffrance, mais aussi réduire le potentiel de l'humanité à long terme. Par ailleurs, certains biais cognitifs nous empêchent d'estimer correctement les risques lorsqu'il s'agit d’événements très rares. Souvent, les électeurs sont très inquiets au sujet de risques peu importants, et n'accordent aucune attention à des risques que les experts considèrent comme extrêmement inquiétants.

Agir

L’altruisme efficace est intellectuellement ambitieux, mais ne fait pas de la rigueur académique son but final. Si nous prenons ces questions au sérieux, c’est car nos actions en dépendent. Les méthodes de l’altruisme efficace peuvent paraître abstraites, mais les vies des personnes que nous aidons sont pleines de souffrances et de joies réelles. Les personnes engagées dans l’altruisme efficace mettent en pratique leurs projets avec le même enthousiasme qui les pousse à analyser leur plans avec précision. Un grand nombre d’entre eux donnent 10% de leur revenu aux causes qu’ils soutiennent. D’autres ont changé leur carrière en profondeur[10].

Pour en savoir plus

Le livre Doing Good Better[11] de William MacAskill apporte un traitement plus approfondi des idées centrales de l’altruisme efficace.

Notes

[1] utilitarianism.com - Traduit de l’anglais par Fanny Verrax (archive)

[2] givingwhatwecan.org (archive)

[3] GiveWell.org (archive)

[4] Pour en savoir plus: GiveWell tente d’identifier les ONG qui aident les habitants des pays en développement le plus efficacement. Les rapports de GiveWell sont accessibles au public et se basent sur plusieurs décennies de recherches rigoureuses dans les domaines de l’économie et de la santé publique.

[5] GiveWell.org (archive)

[6] Gallup et Sachs, 2001 (archive)

[7] Pour en savoir plus: Animal Charity Evaluators tente d’identifier les opportunités de dons les plus efficaces pour aider les animaux et étudie certaines questions empiriques et théoriques cruciales pour la cause animale. La fondation Open Philanthropy Project soutient financièrement des projets pour la réduction de souffrance des animaux d’élevage, et donne un accès public aux résultats de ses recherches.

 

[8] 50 milliards d’animaux terrestres (Organisation des Nations Unies pour l’alimentation et l’agriculture, archive) et environ 80 milliards d’animaux issus de l’aquaculture (A. Mood et P. Brooke, 2012, archive).

[9] Pour en savoir plus: le Future of Humanity Institute à l’Université d’Oxford étudie les questions considérées comme les plus déterminantes pour la trajectoire future de l’humanité. L’article Existential Risk Prevention as Global Priority (Nick Bostrom 2012, Global Policy, archive) est un bon point de départ.

 

[10] 80000hours.org - voir en bas de page la section “people we’ve helped”.

[11] Amazon.fr

July 24, 2016