Lecture des fichiers de données
Lecture des fichiers de données
Pour vous aider à la lecture des fichiers de donnée dans le format parquet, voici les quelques lignes à recopier pour les charger avec quelques languages de traitement de données choisis:
Paris 2024
```{r}
library(arrow, quietly = TRUE)
library(here, quietly = TRUE)
paris_2024 <- read_parquet(here("data/paris_2024.parquet"))
```
```{python}
import pandas as pd
paris_2024 = pd.read_parquet("data/paris_2024.parquet")
```
```{ojs}
db = DuckDBClient.of({
paris_2024: FileAttachment("paris_2024.parquet")
})
```
le fichier paris_2024.xlsx
est prêt à étre ouvert dans LibreOffice, OpenOffice, MicrosoftOffice ou tout autre tableur.
le fichier paris_2024.csv
est disponible pour tous les autres outils.
Restaurants proximité
Le fichier est au format GeoParquet qui peut nécéssiter l’installation d’une librairie spécifique.
Aussi la première ligne de commande vous est optionnelle est vous indique une solution pour son installation.
```{r}
install.packages("sfarrow")
library(sfarrow, quietly = TRUE)
library(here, quietly = TRUE)
restaurant <- st_read_parquet(here("data/restaurants_proximité.geoparquet"))
```
Le fichier est au format GeoParquet qui peut nécéssiter l’installation d’une librairie spécifique.
Aussi la première ligne de commande vous est optionnelle est vous indique une solution pour son installation.
```{shell}
pip install pyarrow
pip install geopandas
```
```{python}
import geopandas as gpd
restaurant = gpd.read_parquet("data/restaurants_proximité.geoparquet")
```
```{ojs}
import {DuckDBClient} from '@cmudig/duckdb'
db = DuckDBClient.of({
FileAttachment("restaurants_proximité.geoparquet")
})
```
le fichier restaurants_proximité.xlsx
est prêt à étre ouvert dans LibreOffice, OpenOffice, MicrosoftOffice ou tout autre tableur.
le fichier restaurants_proximité.csv
est disponible pour tous les autres outils.