Pourquoi coder ? Et pourquoi TypeScript ?
Au fil des années, j’ai été invité à présenter mes projets à des étudiants de divers domaines, à des universitaires, des chercheurs, des professionnels de tout acabit, et lors de conférences. J’ai eu d’innombrables appels vidéo avec des personnes qui ont vu mon travail et s’intéressaient au journalisme computationnel, à l’analyse de données et à la visualisation de données.
Et les mêmes questions revenaient année après année :
- Ai-je vraiment besoin d’apprendre à coder ?
- Et si oui, quel langage devrais-je apprendre ?
Voici donc mes réflexions et pourquoi j’ai décidé de créer ce cours !
Pourquoi coder ?
Les outils basés sur des interfaces cliquables comme Google Sheets et Datawrapper permettent déjà de faire beaucoup. Ils sont fantastiques pour analyser et visualiser rapidement des ensembles de données.
Mais ces outils ont leurs limites.
Par exemple, vous ne pouvez pas traiter de gros volumes de données avec ces outils. De plus, il y aura inévitablement des moments où vous penserez : “Ah ! J’aimerais pouvoir faire ÇA !”, sans pouvoir trouver un moyen d’y arriver à cause des capacités limitées de ces outils.
Avec le code, c’est différent. D’une certaine manière, la programmation informatique vous donne un super-pouvoir.
- Si vous avez des fichiers volumineux contenant des millions de points de données, vous pouvez exploiter la puissance brute de votre ordinateur pour les traiter.
- Si une fonctionnalité n’existe pas, vous pouvez la coder vous-même.
- Si vous avez besoin d’effectuer des tâches répétitives, vous pouvez les automatiser.
Et tout cela peut se faire sur votre ordinateur ou sur un serveur dans l’infonuagique. N’est-ce pas formidable ?
Le code est également plus facile à déboguer et à réutiliser.
Par exemple, imaginez que vous avez créé une feuille de calcul et y avez entré des données. Pour produire votre analyse, vous effectuez 10 étapes impliquant des clics, des sélections de menus et des saisies manuelles dans les cellules. Que se passe-t-il si vous avez fait une erreur à l’étape 3 ? La plupart du temps, vous devrez tout recommencer. C’est lent, frustrant et difficile de vous souvenir exactement de comment vous en êtes arrivé là.
Avec le code, c’est différent. Si vous avez 10 lignes de code et que la troisième ligne est incorrecte, vous corrigez simplement cette ligne. Les autres restent telles quelles. Tout est écrit et sauvegardé, vous pouvez donc toujours y revenir plus tard.
Aussi, le code est juste du texte. Il est facile à partager. Si je dois vérifier vos chiffres, je peux lire votre code ligne par ligne, l’exécuter moi-même pour reproduire vos résultats ou le modifier pour explorer d’autres possibilités. Si vous souhaitez être transparent avec vos lecteurs, vous pouvez également le publier, augmentant ainsi leur confiance dans votre travail.
Et en plus de tout cela, il existe aussi beaucoup de cours de programmation formidables, comme celui-ci. 😉
Quel langage ?
Il existe de nombreux langages de programmation gratuits et en code ouvert, mais les plus populaires pour l’analyse de données sont Python et R. Les deux sont fantastiques, soutenus par des communautés dynamiques qui créent des outils formidables. J’ai personnellement pris beaucoup de plaisir à les utiliser pendant des années.
Cependant, ils ne sont pas idéaux pour publier sur le web, car le web fonctionne dans un autre langage : JavaScript. Et en journalisme comme pour de nombreux autres domaines, publier sur le web est devenu un incontournable.
En parallèle, JavaScript n’était pas un très bon choix pour traiter des données dans le passé, mais il disposait (et dispose encore) de librairies exceptionnelles pour créer des visualisations sur mesure de très grandes qualités.
Cela a conduit à une création en deux étapes pour la plupart des projets de données publiés sur le web :
- Collecter, nettoyer et analyser les données avec Python ou R.
- Visualiser et communiquer les résultats avec JavaScript.
Mais au fil des années, JavaScript a évolué. Le langage a bénéficié d’une mise à niveau majeure avec TypeScript, rendant l’écriture et la gestion de code et de données complexes plus aisée. Les environnements d’exécution JavaScript/TypeScript sont devenus plus accessibles et puissants, et de nouveaux outils sont apparus pour traiter des ensembles de données massifs à des vitesses remarquables.
À mon niveau, j’ai essayé de contribuer au domaine en créant simple-data-analysis, une librairie pour traiter facilement et efficacement les données. J’ai commencé à travailler dessus en avril 2022 et l’ai utilisée pour tous mes projets depuis.
Donc, si je devais recommander un langage aujourd’hui, ce serait TypeScript. Avec lui, vous pouvez répondre à des questions importantes en exploitant des millions et des millions de points de données, tout en communiquant efficacement vos résultats avec le monde entier, sur le web, comme le font les journalistes computationnels.
Et c’est ce que je veux vous enseigner : comment coder un projet axé sur les données avec des visualisations interactives en TypeScript, de A à Z.
Je suis sûr que nous allons nous bien nous amuser en chemin. Alors, codons comme des journalistes ! 😁