IT : DSI/CIO - RSSI/CISO - CDO

Les images satellite et la data science au service de la prévision économique en temps réel

QUANTCUBE

Prévoyez l’économie de demain grâce à l’intelligence macro en temps réel.
Retex de Thanh-Long HUYNH, cofondateur et CEO de QUANTCUBE  Technology

Nowcasting, vision immédiate, QuantCube est spécialisée en IA pour les prévisions macroéconomiques et financières en temps réel à partir du Big Data.  Elle fournit aux entreprises, institutions et pays, des indices macro de prévisions immédiates sur des variables telles que la croissance économique, l’inflation, l’emploi et le commerce international .

En utilisant des données alternatives notamment l’imagerie satellitaire, elle anticipe ainsi les risques économiques et géopolitiques, identifie les dynamiques de développement, les impacts environnementaux, les prix des matières premières… et fournit des informations en avance sur le marché, donnant aux utilisateurs un avantage compétitif dans leurs stratégies d’investissement. 

Et ce, à destination essentiellement du secteur financier avec comme actionnaires Moody’s et Five Capital Advisors.

Lauréat des 2022 GreenTech Innovation Award et gagnant des Waters Technology IMD & IRD 2022 award for Best Alternative Data Initiative, l’entreprise est aussi classée dans le palmarès Fintech100.

Rien de caché qui ne doive être découvert, ni de secret qui ne doive être connu.

Julien Merali : Présentez-nous l’entreprise en quelques mots ?

Thanh-Long Huynh : QuantCube est une société technologique spécialisée en intelligence économique à partir de l’analyse du Big Data. Par Big Data, cela signifie que l’on a accès à quatre types de sources de données : des données textuelles, cela peut être les réseaux sociaux. Différents types de données satellitaires. Des données géolocalisées, typiquement le tracking de navires ou des avions. Et puis les données structurées.

Ce qui fait qu’à partir de l’analyse et le croisement de ces différents types de sources de données, nous sommes capables d’estimer l’économie en temps réel ; c’est-à-dire la croissance économique, l’inflation, le sujet d’actualité où on est extrêmement précis, la production industrielle, etc.

Tout ces indicateurs sont disponibles via une plateforme web et à destination plutôt d’institutions financières pour se positionner sur les marchés financiers.

Notre société va fêter ses 10 ans et connaît une belle croissance. On a une équipe de près de 100 personnes, essentiellement composée de data scientists pour 50% et d’une quinzaine de nationalités.

Julien Merali : Que permettent les données satellitaires ?

Thanh-Long Huynh : Un satellite a 4 ou 5 types de capteurs différents qui nous intéressent. Le premier type de capteur fournit les données d’observation de la terre basse résolution, c’est-à-dire avec une large fauchée. Vous pouvez prendre la photo d’un pays, d’une région, etc. 

Puis nous avons une imagerie haute résolution qui peut descendre jusqu’à 30 cm par pixel, c’est-à-dire que cette table à ciel ouvert, vous la verrez très bien.

Le 2e type de capteur est l’estimation de la composition atmosphérique, de la densité de NO2, de SO2, de gaz polluants. Donc tout ce qui est impact environnemental.

Le 3e type de capteur sont les données radar. Par exemple, le 24 février, début de l’invasion russe en Ukraine, vous avez beaucoup de nuages et vous n’allez pas voir grand-chose. Le radar permet de traverser les nuages. Vous envoyez une onde et vous calculez le temps que cela met pour revenir. Vous pouvez estimer la hauteur de bâtiments ou de ponts par exemple.

Enfin, le 4e type de capteur sont les données radiofréquences, c’est-à-dire pour mesurer tout ce qui est électromagnétique sur différentes longueurs d’ondes.

Voilà le type de capteur que vous avez sur les satellites et à partir de cela, on récupère ces différents types de sources de données pour des applications différentes. 

Julien Merali : Comment récupérez-vous ces données en masse ?

Thanh-Long Huynh : Via le CNES (Centre national d’études spatiales) que je remercie pour leur accompagnement et leur expertise, on a bien compris comment on pouvait capter les différents types de données satellitaires. Par exemple, pour les données observation de la terre ou atmosphérique, vous avez les satellites Sentinel 1 pour le radar, Sentinel 2 pour l’observation de la Terre, Sentinel-5P pour les données atmosphériques. Ce sont des constellations de satellites qui ont été financées et envoyées par l’Agence Spatiale Européenne.

Après, de manière systématique, on peut récupérer les données satellitaires. Mais ce n’est pas parce que vous avez accès à la donnée que vous pouvez l’analyser facilement.

Julien Merali : Comment corrèle-t-on ces données à la finance ?

Thanh-Long Huynh : Nos clients sont des institutions financières qui souhaitent se positionner sur les marchés financiers et qui vont investir dans les actifs risqués quand la croissance économique accélère et se désinvestir quand la croissance économique décélère. 

Maintenant la question est comment estimer la croissance économique en temps réel. Pourquoi en temps réel ? Parce que cela permet d’être trois à quatre mois en avance par rapport à la publication des chiffres officiels. C’est cela notre objectif.

Donc maintenant, quand vous avez un pays où il y a relativement peu de données : je vous donne l’exemple de la Chine ; vous allez prendre par exemple les données satellitaires observation de la terre basse résolution et vous pouvez ainsi suivre la croissance urbaine, ville par ville, sur plusieurs centaines de villes. Donc, plus vous allez voir de la croissance urbaine, plus il y a de la croissance économique. Ça, ce sont les données observation de la terre.

Maintenant vous pouvez également prendre les données de la composition atmosphérique qui va estimer la densité de NO2, le dioxyde d’azote qui est un gaz polluant émis par le secteur industriel.

Donc je prends l’exemple de la ville de Shanghai où l’on voit qu’il y a eu un confinement fin mars et à partir de ces données-là, on voit très bien la densité de pollution qui diminue et donc le ralentissement de la production industrielle.

Et en temps réel, vous pouvez estimer quand est-ce que la production industrielle ralentit et reprend. C’est cela qui intéresse les investisseurs, connaître les points de retournement.

Julien Merali : Et vous pouvez même prévoir l’inflation !

Thanh-Long Huynh : Là, on va récupérer plus de 5 millions de prix par jour, fruits, légumes, énergie, vêtements, voyages etc. et donc, on arrive à très bien estimer l’inflation.

Maintenant comment pourrait-on utiliser les données satellitaires ? On peut estimer la sécheresse et anticiper une baisse de production agricole et une hausse des prix liés aux légumes par exemple.

Julien Merali : Quelle est la volumétrie des données que vous gérez ?

Thanh-Long Huynh : Je vous donne un exemple avec l’analyse des réseaux sociaux : pour les élections américaines de Donald Trump ou de Joe Biden, on a analysé à peu près 20 millions de tweets par jour et parfois des pics de 1 million de tweets toutes les 10 minutes

Avec les données géolocalisées, on suit plus de 80 000 navires et ce toutes les 15 secondes, sans compter plus de 100 000 vols en temps réel.

Puis les données satellitaires ; elles n’arrivent pas toutes les secondes mais chaque image prend plusieurs gigas et on mappe le monde entier avec ces différents types de données. 

On doit être de l’ordre du petabyte.

Julien Merali : Quels types d’algorithmes utilisez-vous pour leur traitement ?

Thanh-Long Huynh : On a des algorithmes de classification supervisée ; par exemple avec des données d’observation de la Terre, on va faire de la classification et être capable de vous dire si c’est un bâtiment commercial, un bâtiment résidentiel, grande surface, un parc d’attraction, etc.

On va faire aussi du Deep learning quand on ne sait pas exactement ce qu’on va rechercher. 

Donc on utilise différents types d’algorithmes en fonction de ce qu’on recherche.

Julien Merali : Y-a-t-il des freins juridiques, RGPD par exemple, à l’utilisation de ces données.

Thanh-Long Huynh : Nous sommes GDPR compliance avant même l’application de la loi en 2018 parce qu’on a également des actionnaires agences de notation qui sont régulés.

Dès qu’il y a un risque GDPR, on nettoie les données.

Julien Merali : Où sont vos données ?

Historiquement en 2013, les données étaient sur nos propres serveurs que l’on avait construit avec des cartes graphiques pour mettre en place les algos de Deep learning, etc. Et nous avons basculé il y a quelques années sur du cloud computing pour beaucoup plus de puissance de calcul.

Propos recueillis par Julien Merali, Général Manager du Pôle IT d’Agora Managers

Afficher plus

Articles similaires

Bouton retour en haut de la page