Modéliser l’accessibilité aux emplois : faut-il déconcentrer les emplois ou regrouper les logements ? Leçons de la Rochelle, Clermont-Ferrand et Marseille

Retranscription de la conférence du 19 janvier 2024 à Sciences Po (Paris)
Colloque Organic Cities

Auteur
Affiliation

OFCE

Date de publication

19 janvier 2024

Modifié

20 mars 2024

Pourquoi modéliser l’accessibilité aux emplois ? Quels sont les liens entre les endroits où habitent les gens et les endroits où ils travaillent ? Quelles sont, en conséquence, les mobilités que cela induit ? Et que peut-on en élaborer ? Pour répondre à ces questions, nous allons utiliser un exercice de modélisation, reposant sur l’utilisation de données, cherchant à faire passer les intuitions et par lequel nous montrons à quel point quantification et modélisation sont nécessaires pour embrasser la complexité sous-jacente de ces phénomènes.

Quantifier permet de comprendre, mais quantifier demande d’écarter de nombreuses dimensions. Il y a donc un arbitrage nécessaire. On peut visualiser de façon frappante certaines choses et la visualisation, même construite par une méthode très complexe, peut être très facile à utiliser et à diffuser. La visualisation sert alors d’outil pour un dialogue qui met les individus autour d’une table pour discuter d’une problématique et accepter les solutions.

Figure 1

La ville n’est pas que l’endroit où l’on habite et où l’on travaille, mais la ville reste beaucoup de ces deux dimensions. Un des invariants des villes est que l’on n’habite pas, dans la grande majorité des cas, au même endroit que celui où l’on travaille. La diversité des situations est immense. Vincent Viguié a montré plus tôt des concentrations et des configurations radicalement différentes entre Hong Kong et Koweït City et on peut l’imaginer, des conséquences différentes sur les mobilités. L’indicateur d’accessibilité à l’emploi décrit un potentiel. Le but de la modélisation présentée ici est de passer du potentiel à ce qu’il se passe effectivement.

1 De quelles données disposons-nous ?

Dans le processus de modélisation, une autre idée est critique. Nous sommes à un moment où nous faisons face à une « avalanche de données ». De nombreuses données arrivent de nombreuses sources. Ces données décrivent, au moins potentiellement, de nombreuses choses. Mais, face à une avalanche de données, émerge un problème. Nous croyons que les données abondantes impliquent une vision plus claire des choses alors que pas du tout : l’avalanche de données est une « avalanche de confusion » et pour sortir de cette confusion il faut trier, structurer et filtrer ce que les données contiennent. La théorie, au sens d’une structure que l’on suppose et que l’on cherche à valider par les données, doit servir de fil directeur pour comprendre les données, pour mettre de l’ordre dans les données, à repérer les évidences, à écarter les anecdotes sans signification et à tirer de la grande masse des mesures une conclusion sur la façon dont le monde fonctionne. Brutes, les données contiennent trop d’éléments, et c’est l’information qui nous intéresse et que nous devons construire en transformant les données.

Figure 2

La première source de données que nous utilisons pour la modélisation sont les données sur les mobilités. Le recensement de la population, fait par l’INSEE, interroge chaque personne (ou presque, le plan de sondage est un peu plus complexe que cela) et demande à ces personnes dans quelle commune elles habitent. Puis, le recensement demande dans quelle commune elles travaillent habituellement. Bien qu’à une résolution spatiale assez frustre, cette information ainsi collectée est d’une grande richesse et permet de reconstruire pour toutes les communes d’origine quels sont les flux vers les communes de destination. Dans cette information, il y a de nombreuses lacunes : « habituellement » est un terme vague, qui prend mal en compte certaines mobilités complexes, qui ne permet pas de distinguer un emploi très routinier et sédentaire d’un emploi qui implique de nombreux déplacements. Impossible de prendre en compte ceux qui ont un emploi localisé chez les clients (un artisan du bâtiment) ou itinérant (un livreur). Mais ces limites n’empêchent pas la richesse d’une information disponible pour une grande variété de territoires, un grand nombre de configurations spatiales ainsi que, puisque le recensement est conduit chaque année, son évolution dans le temps.

La deuxième source d’informations, ce sont les enquêtes mobilité nationales (Enquête mobilité des personnes) ou locales (Enquête Mobilité Certifiée CEREMA). Le point de vue est différent de celui du recensement. On y interroge des ménages, en choisissant un individu dans le ménage, et on recueille tous les détails des déplacements qu’il a effectués le jour de l’enquête : distance parcourue, météo, mode de déplacement, nombre de personnes dans ou sur le véhicule etc… À ces détails sur les trajets accomplis, on ajoute un grand nombre de détails sur l’individu — son âge, son sexe, son statut vis à vis de l’emploi, sa catégorie socio professionelle — ainsi que sur le ménage dont il est membre : structure familiale, revenus du ménage, âge des enfants, nombre et type des véhicules mis à disposition. Bien qu’un grand nombre de ménages soit enquêtés, nous n’avons pas un échantillon assez grand pour pouvoir comparer un territoire à un autre. L’information est donc complémentaire de celle du recensement. À la place d’un information exhaustive sur les territoires, nous disposons d’un grand détail sur le profil de l’individu et les caractéristiques de son déplacement. Si on ne peut pas connaître systématiquement d’où à où sont fait les déplacements, on peut savoir en revanche comment les ménages avec enfants se distinguent des célibataires dans leurs déplacements, quels qu’en soient les motifs. Arriver à joindre ces deux sources de données et à les croiser pour produire une information est un des objectifs d’une modélisation pertinente.

Les dernières sources de données mobilisées sont des données décrivant la géographie. Cela commence par la localisation fine des individus (de leur résidence) et des emplois (leur lieu supposé d’activité, en oubliant les cas complexes). L’INSEE, sur la base des données FIDELI, propose un carroyage avec une résolution de 200 mètres par 200 mètres et fournit, par carreau, le nombre d’individus y résidant, avec quelques détails sur la structure démographique. Pour les emplois, ce sont les fichiers fonciers qui peuvent permettre, moyennant une imputation sur la base des surfaces professionnelles, de traduire les données d’emploi par commune vers des données par carreau. L’hypothèse d’homogénéité du nombre d’emploi par unité de surface professionnelle peut paraître excessive, mais elle est faite par grand secteur d’activité et à l’échelle d’une commune. Le dernier élément de la géographie, qui doit être en rapport avec la résolution obtenue pour les emplois et les résidents, est celle des réseaux de transports. Le réseau routier est bien connu et parfaitement cartographié, identifiant la largeur des voies, les signalisations, les vitesses autorisées ou encore les interdictions de circulation. En les combinant aux informations riches contenues dans les GTFS (General Transit Feed Specification, originellement produit par Google et maintenant en source ouverte), on peut disposer d’une image précise du réseau de transport pour chacun des modes de transport principaux : la marche, le vélo, les transports en commun et la voiture. En utilisant un routeur ou un optimiseur d’itinéraire, moyennant un peu de calcul, on peut estimer les temps de trajets dans chacun des modes pour toutes les combinaisons possibles de carreaux de départ et de destination. Cette masse de données autorise alors une description fine de la géographie et des possibilités de mouvement.

2 Différentes échelles de modélisation : exemples de la Rochelle et de la métropole Aix-Marseille-Provence

L’échelle d’analyse au carreau 200 m est intéressante parce qu’elle autorise une analyse jusqu’au niveau de la position d’un arrêt de bus (parmi un grand nombre d’autres éléments). Cette proximité avec les perceptions individuelles et la possibilité d’analyser les leviers à un échelon très concret est essentielle pour accroître l’impact de l’analyse.

La combinaison de ces sources de données sont autant d’éclairages de la réalité des mobilités et de l’impact de la géographie. Si on connaît bien les réseaux, on ne mesure pas directement les flux et encore moins leur détail par catégorie socio-professionnelle. D’un autre côté, commune par commune, on a une idée précise des mouvements agrégés. Et par les enquêtes mobilités on peut distinguer les nuances des mobilités le long des catégories sociales. Mais chaque éclairage masque les dimensions mises à jour par les autres. Et c’est de ces données complémentaires qu’il faut tirer une information reconstruite, comme on le ferait avec différentes coupes d’un organe dans un appareil d’imagerie médicale.

Les traces numériques sont une source de données prometteuses qui illustrent l’avalanche de données. Elles font espérer une plus grande résolution spatiale ou temporelle et plus de détails sur les itinéraires. Mais, pour autant, elles perdent certains détails : le motif est difficile à identifier, la catégorie sociale obligerait à apparier à des informations protégées sur les individus. Le biais d’échantillon peut polluer les mesures et les rendre trompeuses. Ainsi, s’l y a la promesse de plus de détails, c’est au prix de zones d’ombre ou d’approximations. La modélisation a précisément pour but de faire le mélange en explicitant les hypothèses nécessaires. Ajouter de nouvelles données peut obliger à lever des hypothèses et peut ouvrir des espaces de complexité nouveaux. L’avalanche de données peut nous submerger et nous faire perdre de vue ce que nous voulons étudier. La discipline du modèle est notre boussole.

Le mélange des données, dont le but est de produire une information, consiste fondamentalement à opérer une intrapolation. Plusieurs vues partielles et quelques hypothèses sur la géométrie permettent de reconstruire un objet complet, en utilisant au mieux les données dont on dispose. Dans notre approche, ce mélange est formalisé dans une équation.

Figure 3

Chacun des termes de l’équation correspond à une des données que nous allons utiliser puis, en multipliant chacun des termes, nous produisons l’extrapolation. L’hypothèse est que chacun des termes de l’équation est indépendant des autres. Cette hypothèse est discutable mais, sans plus de données, elle est la plus simple et la plus directe à faire. Faute de preuve du contraire, elle est celle qu’on suivra. L’équation, compte tenu des données dont on dispose, représente la spéculation minimale que nous sommes obligés de faire.

Figure 4

À la Rochelle, notre laboratoire d’expérimentation pour ce travail, il y a approximativement 5’000 carreaux de « résidence » et à peu près autant de carreaux « emploi ». L’emploi est plus concentré et le bassin d’emploi du périmètre de la Rochelle est plus étendu que le périmètre des résidents. Les deux éléments se compensent et nous aboutissons à un nombre proche de carreaux. Le nombre de paires de temps de parcours est le produit de 5’000 par 5’000, soit 25 millions. En multipliant par les 4 modes, nous obtenons 100 millions de paires de distances.

Pour la métropole d’Aix-Marseille-Provence, pour laquelle nous appliquons la même méthode, l’échelle change. Le nombre de paires de distances est de quelques milliards, puisque les carreaux de résidence sont au nombre de 25’000 et ceux d’emploi à peu près 40’000.

Cette volumétrie est importante pour comprendre la profondeur envisageable de l’analyse sociologique. Nous découpons les ménages en catégories, c’est l’indice k dans l’équation. C’est important pour intégrer une autre dimension de la géographie (par exemple, les ménages avec enfants n’habitent pas en centre ville en général), mais il est nécessaire de rester parcimonieux. Le nombre de catégories vient en effet se multiplier avec celui des paires de distance.

Figure 5

3 Modéliser les émissions de CO2 des habitants selon leur lieu de résidence et leur lieu de travail

Comme l’indique l’équation, la méthode vise à imputer les émissions de CO2 aux résidents de chaque carreau. D’autres méthodes peuvent imputer les émissions le long du trajet ou imputer en chaque point les émissions des trajets qui passent par ce point. L’approche que nous utilisons s’inscrit dans la lignée de la convention « consommateur ». On attribue à chaque individu les émissions qu’il produit et on les impute géographiquement au lieu de résidence et non au lieu d’émission. Ceci permet aussi de comprendre pourquoi nous nous limitons à un territoire qui a une dimension « politique ». C’est le territoire dans lequel résident des ménages et des individus, à partir duquel ils ont des activités, éventuellement hors de ce territoire. Le territoire est également visité par des individus qui viennent de l’extérieur. Leurs émissions ne sont pas imputés sur le territoire considéré. Le périmètre choisi est celui qui correspond à la responsabilité du SCoT. C’est par exemple le périmètre de décision pour déterminer les zones qui accueilleront les nouveaux habitants et donc qui engendreront les futurs déplacements.

Figure 6

La carte des émissions de CO2, présentée ci-dessus, est une reconstruction et pas une mesure directe de la réalité. Il n’est pas possible, à ce stade, de produire une mesure directe, carreau par carreau des émissions de CO2 dont est responsable chaque résident. Le jour où cette information sera directement disponible, la confronter au modèle sera intéressant et très utile pour valider le modèle que nous employons pour générer la carte. En attendant, le modèle, et donc la carte, est validée parce qu’elle est conforme aux données dont on dispose et qui ont servi à la construire. Le recensement nous indique par exemple les flux de commune à commune. Les données nécessaires pour la carte intrapolent ces flux carreau à carreau, de façon à ce que l’on retrouve le recensement commune à commune. Ce qui est vrai pour le recensement est vrai pour les autres sources de données employées. Elles découlent d’une agrégation selon une dimension plus ou moins complexe des données impliquées par l’équation fondamentale du modèle. Et cette agrégation est telle qu’elle est le plus proche possible de ce qui est observé. Ainsi, lorsqu’on ajoute les émissions de tous les carreaux de résidence de cette carte pour l’ensemble du territoire on obtient un chiffre d’émissions totales qui est très proche, par construction, de celui que l’on produit habituellement pour le territoire de la Rochelle.

Avec ces données parcellaires ou des données directes qui seront peut être disponibles un jour, la validation du modèle apporte la possibilité non seulement d’utiliser avec plus de confiance les données générées pour la carte (l’intrapolation) mais aussi de pouvoir regarder ce qui se passerait si (l’extrapolation) on modifiait un élément de la géographie (une nouvelle population localisée dans un endroit particulier ou une modification du réseau de transport, la liste est infinie).

Un des apports de cette carte est de produire le ratio entre la quantité de CO2 qui est consommée par un habitant par exemple du centre de la Rochelle et un autre habitant dans la périphérie lointaine de l’agglomération de la Rochelle. Ce ratio est assez important, entre un facteur 3 et 4 et il n’en existe aujourd’hui pas de mesure directe. L’estimation de ce ratio présentée ici tient compte, en utilisant le mieux possible l’information disponible, de la géographie, de ce que l’on sait des déplacements commune à commune, des choix modaux des ménages, de la disponibilité d’une voiture dans le ménage et de la distance à l’emploi.

Cette carte produit donc une information critique pour les territoires. Non pas pour désigner les responsables des émissions et les blâmer, mais plutôt pour comprendre comment le tri spatial qui est opéré par l’offre de logement, leurs prix au m², l’offre de transports ou la localisation des emplois conditionnent les comportements des individus. Si elle ne désigne pas les responsables, elle indique en tout cas quelles seront les responsabilités de politiques publiques si elles laissent s’engager le développement du territoire dans des directions qui sont à l’opposé de l’objectif de neutralité carbone. Elle rappelle que les mobilités quotidiennes, pour le seul motif d’emploi, sont un poste important d’émission — jusqu’à 3 tCO2/an/actif et donc un levier central pour la réduction des émissions de gaz à effet de serre.

Figure 7

Le graphique ci-dessus est construit sur les mêmes données que la carte de COsub>2. Il comporte 4 dimensions. Chaque point sur ce graphique correspond à un des carreaux de la carte de COsub>2. Sur l’axe des x, on a représenté le niveau de vie moyen dans le carreau, c’est-à-dire le revenu divisé par les unités de consommation pour chaque individu dans le carreau. Sur l’axe des y, se trouve le nombre de kilomètres parcourus par an en moyenne par les individus dans ce carreau. La courbe grise indique la relation (univariée) entre les kilomètres et le niveau de vie. Pour La Rochelle, cette courbe est en cloche. Les plus pauvres n’ont pas les moyens de se déplacer en voiture et les plus riches peuvent habiter le centre ville. Ces deux catégories font donc peu de kilomètres. Entre les deux, et probablement en lien avec le nombre d’enfants, l’arbitrage coût de transport / coût de l’immobilier les conduit à chercher de grandes surfaces pas trop chères, mais induisant des coûts de déplacement importants. Une grande variance existe dans cette catégorie de revenu — habiter une petite surface permet de se localiser plus près de l’emploi, mais la relation est plutôt croissante puis décroissante avec le revenu. Sur d’autres territoires, notamment Aix-Marseille-Provence, la relation est sensiblement différente. Cela illustre l’intérêt d’analyser finement les conséquences de la géographie.

Sur le graphique précédent, chaque point a une couleur en fonction du prix de l’immobilier. Plus il est orangé, plus le niveau de prix est important. La structure des prix de l’immobilier suit fortement celle de l’accessibilité à l’emploi. C’est le modèle concentrique très répandu en Europe. La concentricité n’est pas organisée autour du centre-ville, une notion assez difficile à définir en dehors d’un recours à l’histoire, mais plutôt par l’accessibilité à l’emploi. Comme prédit la théorie économique urbaine, le prix de l’immobilier opère un (puissant) tri spatial, mais il n’empêche pas les plus pauvres d’habiter dans le centre-ville. En effet, ceux-ci peuvent accéder d’une part au logement social ou habiter dans des surfaces très réduites.

4 Modéliser les effets des politiques publiques

La visualisation du territoire sous des angles nouveaux et pertinents pour les politiques publiques est un des résultats frappant de l’exercice de modélisation et d’ajustement aux données disponibles. Mais la modélisation employée permet d’aller au-delà de l’analyse statique du territoire. On peut étudier des scénarios de modification de nombreux paramètres. Par exemple, on peut changer l’endroit où se trouvent les arrêts de bus, ajouter une ligne de train ou une gare sur une ligne existante. On peut ralentir les voitures ou accélérer les vélos et induire un transfert modal en faveur de prendre plutôt la voiture que les transports en commun. Cela peut être décliné par catégories sociales, par localisation géographique et peut être combiner avec un jeu de politiques publiques pour en analyser les complémentarités.

Figure 8

Le graphique ci-dessous présente le résultat de l’exercice de pensée suivant : si on augmente la densité dans chacun des IRIS, un par un, du territoire, en ajoutant 1% de la population, que ce passe-t-il sur le nombre de kilomètres parcourus ? L’élasticité obtenue (en ramenant la variation en % des kilomètres parcourus totaux à la hausse de la population totale) dépend fortement de l’endroit où est réalisée la densification. Cela peut paraître intuitif, mais le lien entre densité et kilomètres parcourus est souvent considéré comme assez ténu (de l’ordre de 0,1), probablement parce que dans les analyses habituelles la dimension géographique est omise. Suivant l’endroit, l’élasticité peut être très négative (-1) ou très positive (+1). Ceci illustre l’importance de bien choisir les zones de développement. Pour une agglomération comme La Rochelle, où la population augmente de 1% par an, en cumulant sur les 30 prochaines années, on peut pour ce qui est des kilomètres parcourus, en suivant les localisations des seuls nouveaux arrivants, les réduire de 30%, n’avoir aucun impact ou encore les accroître de 30%.

Figure 9

Alternativement, nous pouvons analyser également ce qui se passerait si nous localisions différemment les emplois. Huit zones d’activité sont considérées, réparties dans le territoire.

Figure 10

Certaines de ces zones sont dans des zones plutôt rurales, d’autres sont dans la zone directement périphérique du centre-ville de La Rochelle. Cela permet de définir trois scénarios : concentration, déconcentration ou répartition. Les trois cartes reproduites ci-dessous indiquent les endroits où les kilomètres parcourus augmentent (brun) ou diminuent (bleu). Les effets sont complexes et leur répartition spatiale hétérogène. Le bilan entre ces effets positifs et négatifs produit le résultat final.

Figure 11

Ce résultat illustre également la complexité de l’aménagement du territoire. Aucune mesure n’a de résultat entièrement positif ou négatif. Au-delà de ces scénarios, il est possible de pousser encore plus loin les curseurs. On s’écarte d’un scénario praticable, puisqu’il impliquerait des bouleversements massifs. Néanmoins l’exercice montre que la localisation de l’emploi n’a pas des effets très forts même dans des scénarios extrêmes. À moins de considérer les deux zones d’activités proches de La Rochelle, le diagnostic est que plus d’emplois dans ces zones plutôt éloignés des zones denses d’habitat induit une augmentation du nombre de kilomètres parcourus en voiture. C’est assez logique, puisqu’elles ne sont pas desservies par des transports en commun et donc que les déplacements pour s’y rendre se font principalement en voiture. Pour les zones « Atlanparc » et « Belle-Aire Nord » il est possible de générer une diminution des kilomètres parcourus, mais elle est modeste (de l’ordre de 1%). L’enjeu est donc moins sur la localisation des emplois que sur celle des résidents. Cela tient principalement au fait que les scénarios d’emploi sont ici basés sur des zones d’activité et pas sur des scénarios diffus de localisation de l’emploi près des zones de résidence, susceptible de produire des trajets à pied ou en vélo plutôt qu’en voiture.

Figure 12

L’usage de modèles, d’autant qu’ils s’appuient sur des données et qu’ils sont à même de produire des extrapolations et des interpolations robustes peut aider à l’articulation des politiques et à la discussion entre les acteurs.

Réutilisation

Citation

BibTeX
@inproceedings{timbeau2024,
  author = {Timbeau, Xavier},
  publisher = {Sciences Po \& Villes Vivantes},
  title = {Modéliser l’accessibilité aux emplois : faut-il déconcentrer
    les emplois ou regrouper les logements\,? Leçons de la Rochelle,
    Clermont-Ferrand et Marseille},
  date = {2024-01-19},
  url = {https://papers.organiccities.co/modeliser-l-accessibilite-aux-emplois-faut-il-deconcentrer-les-emplois-ou-regrouper-les-logements-lecons-de-la-rochelle-clermont-ferrand-et-marseille.html},
  langid = {fr}
}
Veuillez citer ce travail comme suit :
Timbeau, X. (2024, January 19). Modéliser l’accessibilité aux emplois : faut-il déconcentrer les emplois ou regrouper les logements ? Leçons de la Rochelle, Clermont-Ferrand et Marseille. Organic Cities, Paris. Sciences Po & Villes Vivantes. https://papers.organiccities.co/modeliser-l-accessibilite-aux-emplois-faut-il-deconcentrer-les-emplois-ou-regrouper-les-logements-lecons-de-la-rochelle-clermont-ferrand-et-marseille.html