Préparations
Préparer son environnement de programmation
1. Installer anaconda
Conda permet de créer des environnements comparables à travers différents systèmes d’exploitation. Pour l’installer, suivez les instructions ci-dessous, en fonction de votre système d’exploitation (windows, mac, linux):
https://docs.anaconda.com/anaconda/install/
2. Créer un environnement conda avec python 3.10
Ouvrez un terminal (sous windows, via anaconda 1) et exécutez la commande suivante :
conda create --name py python=3.10
Par la suite, l’environnement devra être activé à chaque session, en tapant:
conda activate py
3. Préinstaller des paquets python avec pip
Une fois l’environnement conda activé, vous pouvez installer des “paquets” python qui étendent les fonctionnalités de base du langage. Pour cela, nous utilisons le gestionnaire de paquets python “pip”.
Vous pouvez d’ores-et-déjà installer les paquets, qui seront nécessaires pour reproduire les exemples du cours:
pip install numpy pandas fastparquet scipy networkx bertopic notebook matplotlib datalad
4. Installer Gephi
Téléchargez et installer gephi, une interface graphique pour la visualisation de réseaux.
5. Télécharger les notebooks et données du cours
Vous pouvez installer les notebooks ainsi:
git clone https://github.com/ssc-ehess/notebooks.git
Pour les données, il y a deux approches:
a. Le téléchargement manuel b. Le téléchargement automatique
a. Téléchargement manuel
- Téléchargez la ou les archives souhaitées depuis la page des datasets: ssc-ehess.github.io/datasets/.
- Placez les dans le dossier “notebooks”.
- Extrayez l’archive dans le dossier notebooks.
b. Téléchargement automatique
Installez `datalad’, qui permet de téléchargement facilement les données du cours:
conda install -c conda-forge datalad
Depuis le dossier contenant les notebooks, tapez:
datalad install science
datalad install twitter
Cela ne télécharge pas automatiquement les données, qui prennent un peu de place. Si vous souhaitez utiliser le dataset climat, par exemple, faites:
datalad get science/climate -s s3
Pour twitter:
datalad get twitter
5. Ouvrir les notebooks
Pour lancer un notebook:
- Ouvrir le terminal
- Placez vous dans le répertoire notebooks (e.g.
cd notebooks
). [Pour connaître votre position dans l’arborescence:pwd
] - Exécutez la commande:
jupyter notebook
- Un onglet va s’ouvrir dans votre navigateur. Vous pourrez alors ouvrir le notebook de votre choix.
TIP
N’oubliez pas de mettre régulièrement vos notebooks à jour en tapant
git pull
dans le terminal.
-
Pour lancer le terminal Anaconda sous windows, appuyez sur les touches (Win + S), et tapez “Anaconda Prompt” (d’après ChatGPT…). ↩