Aller au contenu

Données testset

Deux niveaux de données de démonstration sont disponibles.

Le sample historique léger sert à vérifier rapidement que le package fonctionne :

package-xyt-gps/examples/sample_data/sample_data_marced_motiontag.pkl

Ce fichier reste local et n'est pas versionné. Le code actif ne dépend pas du dossier archive/.

Chargement du sample léger :

import xyt_gps as xyt

testset_config = xyt.ProjectConfig(
    experiment_name="testset-demo",
    motiontag_project_name="sample-motiontag",
    period="testset",
    raw_data_dir=".",
)

raw = xyt.load_sample_gps(max_rows=800)
dataset = xyt.prepare_mobility_dataset(raw, testset_config)

Sample léger

load_sample_gps() :

  • charge une storyline GPS réelle fournie pour la démonstration ;
  • pseudonymise user_id en sample_user par défaut ;
  • ajoute des trip_id synthétiques aux lignes Track ;
  • dérive des tables Trips, Journeys et UserStatistics minimales ;
  • valide le schéma produit.

Limite

Ces données servent à apprendre le package et à inspecter les états de transformation. Les tables dérivées ne sont pas des exports fournisseur originaux.

Test set générique avec phases

Pour tester un flux plus réaliste, utiliser le générateur local :

python package-xyt-gps/examples/build_generic_test_set.py

Il écrit :

Data/Output/test-set-gps

Ce test set contient :

Élément Valeur
expérimentation test_set
utilisateurs 15
phases Phase1, Phase2, Phase3
période printemps 2026
tables storyline, trips, journeys, user_statistics, user_presence, public_transport_legs si disponible

Le générateur part d'un dossier landing anonymisé, par exemple Data/Output/0-landed-data/declic-mobility-ziplo/anonymized. Il applique une seconde pseudonymisation des user_id, remplace les identifiants de lignes, recale les dates au printemps 2026 et applique une translation spatiale déterministe supplémentaire aux géométries.

Le notebook recommandé est :

package-xyt-gps/examples/demo-gps-test-set-phases.ipynb

Les fichiers générés restent locaux et ignorés par git.

Dataset synthétique multi-expérimentations

Pour tester un workflow proche de Déclic avec plusieurs expérimentations, plusieurs phases et des trackings incomplets, utiliser la génération synthétique :

import xyt_gps as xyt

synthetic = xyt.generate_synthetic_declic_gps(
    users_per_experiment=50,
    random_state=42,
)

raw = synthetic.raw
user_presence = synthetic.user_presence

Voir Données synthétiques Déclic.

Licence des données testset

Le testset est fourni uniquement pour la démonstration, les tests et l’apprentissage du package. Tout usage commercial, toute tentative de réidentification et toute redistribution hors du dépôt ou d’un fork conservant les mêmes conditions sont interdits sans accord écrit préalable de Bureau Action Située.

Voir LICENSE.sample-data.md et Licence et citation.