Aller au contenu

Dictionnaire des variables

Date : 2026-06-09

Source de contexte : Data/dumps_situee/RENDU250815_gps_prefiguration_clean/dictionnaire_variables.xlsx.

Ce document rend le dictionnaire livré dans le précédent projet accessible dans le dépôt du package. Il décrit les tables exportées, les variables, les types observés, les taux de valeurs manquantes et les descriptions disponibles.

Limite : les types et taux de valeurs manquantes reflètent le dump de préfiguration livré le 2025-08-15. Ils ne doivent pas être interprétés comme un contrat universel pour toutes les expérimentations.

Comment lire une ligne du dictionnaire

Chaque ligne décrit une variable observée dans une table de sortie. Exemple tiré de la table legs :

variable dtype type_variable missing_percent modalites interprétation package
length int32 Continue 0% Min: 3.00, Max: 9114420.00, Moyenne: 7887.43 longueur du leg fournie ou conservée dans la table de mobilité
relative_signal_loss float64 Continue 0% Min: 0.00, Max: 1.00, Moyenne: 0.25 plus grand saut GPS divisé par la longueur métrique du leg
low_quality_legs_1 int64 Dummy/Binaire 0% [0, 1] flag de qualité GPS selon le niveau 1 de seuils par mode
bad_signal_user int64 Catégorielle 0% [0] dans le dump livré flag utilisateur, calculé à partir des pertes de signal moyennes

Un dictionnaire de variables n’est donc pas seulement une liste de colonnes. Il indique aussi le type observé, la complétude et l’usage analytique attendu. Dans xyt_gps, les variables dérivées doivent rester reliées à une fonction explicite ou à une hypothèse documentée.

Synthèse par table

dataset variables
journey 19
legs 28
legs_info 17
occupancy_co2 4
public_transport 8
staypoints 30
trips 19
user_stats 49

Legs

variable dtype type_variable missing_count missing_percent modalites description
leg_id object Identifiant 0 0% 27334 identifiants uniques Variable identifiant unique
user_id_day object Identifiant 0 0% 2584 identifiants uniques Variable identifiant unique
legs_date datetime64[ns] Temporelle 0 0% 2025-04-07 00:00:00 à 2025-06-29 00:00:00 Variable temporelle (dates/heures)
user_id object Identifiant 0 0% 50 identifiants uniques Variable identifiant unique
type object Catégorielle nominale 0 0% ['Track'] Variable catégorielle (1 modalités)
started_at datetime64[ns, UTC] Temporelle 0 0% 2025-04-07 16:41:31+00:00 à 2025-06-29 22:18:07+00:00 Variable temporelle (dates/heures)
started_at_timezone object Temporelle avec timezone 0 0% Africa/Casablanca à Pacific/Tahiti Variable temporelle avec information de fuseau horaire
finished_at datetime64[ns, UTC] Temporelle 0 0% 2025-04-07 16:44:40+00:00 à 2025-06-29 22:55:32+00:00 Variable temporelle (dates/heures)
finished_at_timezone object Temporelle avec timezone 0 0% Africa/Casablanca à Pacific/Tahiti Variable temporelle avec information de fuseau horaire
length int32 Continue 0 0% Min: 3.00, Max: 9114420.00, Moyenne: 7887.43 Variable numérique continue
mode object Texte 0 0% 24 valeurs uniques Variable texte libre
geometry geometry Géospatiale 0 0% LineString GPS tracks Géométrie du segment de déplacement
started_on datetime64[ns, UTC] Temporelle 0 0% 2025-04-07 00:00:00+00:00 à 2025-06-30 00:00:00+00:00 Variable temporelle (dates/heures)
started_at_in_timezone datetime64[ns, UTC] Temporelle 0 0% 2025-04-07 16:41:31+00:00 à 2025-06-29 22:18:07+00:00 Variable temporelle (dates/heures)
finished_at_in_timezone datetime64[ns, UTC] Temporelle 0 0% 2025-04-07 16:44:40+00:00 à 2025-06-29 22:55:32+00:00 Variable temporelle (dates/heures)
trip_id object Identifiant 173 1% 12342 identifiants uniques Variable identifiant unique
Phase object Catégorielle nominale 0 0% ['Before_Phase1', 'Phase1', 'Other', 'Phase2', 'Phase3'] Variable catégorielle (5 modalités)
mode_niv1 object Catégorielle nominale 0 0% ['Marche', 'TP', 'Vélo', 'Voiture', 'Autres'] Variable catégorielle (5 modalités)
mode_niv2 object Catégorielle nominale 0 0% ['Marche', 'Train', 'TPU', 'Vélo', 'Voiture', 'Autres', 'Carsharing'] Variable catégorielle (7 modalités)
date_only datetime64[ns] Temporelle 0 0% 2025-04-07 00:00:00 à 2025-06-29 00:00:00 Variable temporelle (dates/heures)
duration Int64 Autre 0 0% 3432 valeurs uniques Type de données: Int64
extreme98_length_mode bool Dummy/Binaire 0 0% [np.False_, np.True_] Variable binaire (True/False)
extreme99_length_mode bool Dummy/Binaire 0 0% [np.False_, np.True_] Variable binaire (True/False)
relative_signal_loss float64 Continue 0 0% Min: 0.00, Max: 1.00, Moyenne: 0.25 Variable numérique continue
low_quality_legs_1 int64 Dummy/Binaire 0 0% [np.int64(0), np.int64(1)] Variable binaire numérique (0/1 )
intra_GE float64 Catégorielle 0 0% [np.float64(1.0), np.float64(0.5), np.float64(0.0)] Variable catégorielle (3 modalités)
origin_canton object Catégorielle nominale 0 0% ['GE', 'VD', 'NE', 'FR', 'ZH', 'BE', 'VS', 'HorsCHE', 'LU', 'SO'] Variable catégorielle (20 modalités)
destination_canton object Catégorielle nominale 0 0% ['GE', 'VD', 'NE', 'FR', 'ZH', 'BE', 'VS', 'HorsCHE', 'LU', 'SO'] Variable catégorielle (20 modalités)

Trips

variable dtype type_variable missing_count missing_percent modalites description
trip_id object Identifiant 0 0% 12344 identifiants uniques Variable identifiant unique
user_id object Identifiant 0 0% 50 identifiants uniques Variable identifiant unique
started_at datetime64[ns, UTC] Temporelle 0 0% 2025-04-07 16:41:31+00:00 à 2025-06-29 22:18:07+00:00 Variable temporelle (dates/heures)
finished_at datetime64[ns, UTC] Temporelle 0 0% 2025-04-07 17:02:09+00:00 à 2025-06-29 22:55:32+00:00 Variable temporelle (dates/heures)
main_mode object Texte 0 0% 24 valeurs uniques Variable texte libre
modes object Texte 0 0% 1321 valeurs uniques Variable texte libre
long_distance bool Dummy/Binaire 0 0% [np.False_, np.True_] Variable binaire (True/False)
tracks_count Int64 Autre 0 0% 24 valeurs uniques Type de données: Int64
tracks_count_without_walks int64 Catégorielle 0 0% [np.int64(1), np.int64(3), np.int64(0), np.int64(2), np.int64(4), np.int64(5), np.int64(6), np.int64(8), np.int64(10), np.int64(7)] Variable catégorielle (12 modalités)
purpose object Catégorielle nominale 64 1% ['Family & Friends', 'At home', 'Shopping', 'Eat out', 'Other', 'Leisure', 'Sports', 'Errand', 'Medical visit', 'Working'] Variable catégorielle (14 modalités)
duration Int64 Autre 0 0% 4428 valeurs uniques Type de données: Int64
distance Int64 Autre 0 0% 6713 valeurs uniques Type de données: Int64
created_at datetime64[ns, UTC] Temporelle 0 0% 2025-04-08 07:18:41+00:00 à 2025-07-06 14:09:11+00:00 Variable temporelle (dates/heures)
purpose_mrmt object Catégorielle nominale 0 0% ['Loisir', 'Domicile', 'Achat et services', 'Tout motifs', 'Travail', 'Accompagnement', 'Formation'] Variable catégorielle (7 modalités)
main_mode_niv1 object Catégorielle nominale 0 0% ['Voiture', 'TP', 'Marche', 'Vélo', 'Autres'] Variable catégorielle (5 modalités)
modes_niv1 object Texte 0 0% 724 valeurs uniques Variable texte libre
leading_activity_id object Identifiant 228 2% 12116 identifiants uniques Variable identifiant unique
trip_origin_canton object Catégorielle nominale 0 0% ['GE', 'HorsCHE', 'BS', 'ZH', 'VS', 'VD', 'NE', 'LU', 'BE', 'FR'] Variable catégorielle (20 modalités)
trip_destination_canton object Catégorielle nominale 0 0% ['GE', 'VS', 'HorsCHE', 'TI', 'NE', 'VD', 'ZH', 'BE', 'FR', 'JU'] Variable catégorielle (20 modalités)

Staypoints

variable dtype type_variable missing_count missing_percent modalites description
activity_id object Identifiant 0 0% 19172 identifiants uniques Variable identifiant unique
user_id object Identifiant 0 0% 50 identifiants uniques Variable identifiant unique
type object Dummy/Binaire 0 0% ['Stay', 'Resampled_stay'] Variable binaire textuelle (Stay/Resampled_stay )
started_at datetime64[ns, UTC] Temporelle 0 0% 2025-04-07 15:33:51+00:00 à 2025-06-29 22:55:32+00:00 Variable temporelle (dates/heures)
started_at_timezone object Temporelle avec timezone 0 0% 2025-04-11 00:00:01+0000 à Pacific/Tahiti Variable temporelle avec information de fuseau horaire
finished_at datetime64[ns, UTC] Temporelle 0 0% 2025-04-07 16:41:31+00:00 à 2025-06-30 17:03:50+00:00 Variable temporelle (dates/heures)
finished_at_timezone object Temporelle avec timezone 0 0% 2025-04-11 23:59:59+0000 à Pacific/Tahiti Variable temporelle avec information de fuseau horaire
purpose object Catégorielle nominale 163 1% ['home', 'leisure', 'shopping', 'eat', 'work', 'wait', 'unknown', 'errand', 'family_friends', 'sport'] Variable catégorielle (14 modalités)
geometry geometry Géospatiale 163 1% LineString GPS tracks Géométrie du segment de déplacement
confirmed_at datetime64[ns, UTC] Temporelle 9350 49% 2025-04-09 06:38:53.380000+00:00 à 2025-07-06 14:10:30.118000+00:00 Variable temporelle (dates/heures)
started_on datetime64[ns, UTC] Temporelle 0 0% 2025-04-07 00:00:00+00:00 à 2025-06-30 00:00:00+00:00 Variable temporelle (dates/heures)
misdetected_completely object Dummy/Binaire 0 0% ['f', 't'] Variable binaire textuelle (f/t )
merged object Catégorielle nominale 0 0% ['f'] Variable catégorielle (1 modalités)
created_at datetime64[ns, UTC] Temporelle 0 0% 2025-04-07 18:14:11.813000+00:00 à 2025-08-15 10:02:23+00:00 Variable temporelle (dates/heures)
updated_at datetime64[ns, UTC] Temporelle 0 0% 2025-04-08 07:18:41.633000+00:00 à 2025-08-15 10:02:23+00:00 Variable temporelle (dates/heures)
started_at_in_timezone datetime64[ns, UTC] Temporelle 0 0% 2025-04-07 15:33:51+00:00 à 2025-06-29 22:55:32+00:00 Variable temporelle (dates/heures)
finished_at_in_timezone datetime64[ns, UTC] Temporelle 0 0% 2025-04-07 16:41:31+00:00 à 2025-06-30 17:03:50+00:00 Variable temporelle (dates/heures)
confirmed_at_in_timezone datetime64[ns, UTC] Temporelle 9187 48% 2025-04-09 06:38:53+00:00 à 2025-08-15 10:02:23+00:00 Variable temporelle (dates/heures)
created_at_in_timezone datetime64[ns, UTC] Temporelle 0 0% 2025-04-07 18:14:11+00:00 à 2025-08-15 10:02:23+00:00 Variable temporelle (dates/heures)
updated_at_in_timezone datetime64[ns, UTC] Temporelle 0 0% 2025-04-08 07:18:41+00:00 à 2025-08-15 10:02:23+00:00 Variable temporelle (dates/heures)
comment_feedback object Texte 18977 99% 28 valeurs uniques Variable texte libre
trip_id object Identifiant 12735 66% 4093 identifiants uniques Variable identifiant unique
Phase object Catégorielle nominale 0 0% ['Before_Phase1', 'Phase1', 'Other', 'Phase2', 'Phase3'] Variable catégorielle (5 modalités)
purpose_niv1 object Catégorielle nominale 163 1% ['Domicile', 'Loisir', 'Achat', 'Travail', 'Attente', 'Autre', 'Santé'] Variable catégorielle (7 modalités)
date_only datetime64[ns] Temporelle 0 0% 2025-04-07 00:00:00 à 2025-06-29 00:00:00 Variable temporelle (dates/heures)
lon float64 Continue 163 1% Min: -149.61, Max: 30.74, Moyenne: 6.17 Variable numérique continue
lat float64 Continue 163 1% Min: -17.56, Max: 55.70, Moyenne: 45.89 Variable numérique continue
duration int32 Continue 0 0% Min: 31.00, Max: 86398.00, Moyenne: 10758.51 Variable numérique continue
activity_in_country object Texte 0 0% 22 valeurs uniques Variable texte libre
activity_in_canton object Texte 0 0% 41 valeurs uniques Variable texte libre

Occupancy Co2

variable dtype type_variable missing_count missing_percent modalites description
leg_id object Identifiant 0 0% 27334 identifiants uniques Variable identifiant unique
occupancy_rate float64 Catégorielle 0 0% [np.float64(1.0), np.float64(2.08), np.float64(1.81), np.float64(1.8), np.float64(1.91), np.float64(1.92), np.float64(2.16), np.float64(2.41), np.float64(2.15), np.float64(2.64)] Variable catégorielle (17 modalités)
g_CO2_km float64 Catégorielle 326 1% [np.float64(0.0), np.float64(7.0), np.float64(42.8), np.float64(8.0), np.float64(5.6), np.float64(90.5), np.float64(298.3), np.float64(36.2), np.float64(161.3), np.float64(10.6)] Variable catégorielle (15 modalités)
g_CO2_direct_km float64 Catégorielle 326 1% [np.float64(0.0), np.float64(0.1), np.float64(0.4), np.float64(63.5), np.float64(180.8), np.float64(0.2), np.float64(123.7), np.float64(223.6), np.float64(90.4), np.float64(100.0)] Variable catégorielle (10 modalités)

Legs Info

variable dtype type_variable missing_count missing_percent modalites description
leg_id object Identifiant 0 0% 27334 identifiants uniques Variable identifiant unique
geometry_map_matched geometry Autre 0 0% 26310 valeurs uniques Type de données: geometry
map_match_source object Catégorielle nominale 0 0% ['osrm', 'motiontag', 'google'] Variable catégorielle (3 modalités)
mode object Texte 0 0% 24 valeurs uniques Variable texte libre
detected_mode object Catégorielle nominale 0 0% ['Mode::Walk', 'Mode::Train', 'Mode::Tram', 'Mode::RegionalTrain', 'Mode::Bicycle', 'Mode::Bus', 'Mode::Car', 'Mode::LightRail', 'Mode::Ferry', 'Mode::Carsharing'] Variable catégorielle (16 modalités)
origin_osm_id float64 Continue 4236 15% Min: 0.00, Max: 13016377360.00, Moyenne: 5679758120.53 Variable numérique continue
destination_osm_id float64 Continue 4236 15% Min: 0.00, Max: 13016377360.00, Moyenne: 5664341555.77 Variable numérique continue
started_on datetime64[ns, UTC] Temporelle 0 0% 2025-04-07 00:00:00+00:00 à 2025-06-30 00:00:00+00:00 Variable temporelle (dates/heures)
confirmed_at object Temporelle avec timezone 12805 47% 14529 valeurs uniques Variable temporelle avec information de fuseau horaire
created_at datetime64[ns, UTC] Temporelle 0 0% 2025-04-07 18:14:11.854000+00:00 à 2025-07-01 21:14:49.785000+00:00 Variable temporelle (dates/heures)
updated_at datetime64[ns, UTC] Temporelle 0 0% 2025-04-07 18:14:11.854000+00:00 à 2025-07-06 14:10:30.101000+00:00 Variable temporelle (dates/heures)
confirmed_at_in_timezone datetime64[ns, UTC] Temporelle 12805 47% 2025-04-09 06:38:53+00:00 à 2025-07-06 14:10:30+00:00 Variable temporelle (dates/heures)
created_at_in_timezone datetime64[ns, UTC] Temporelle 0 0% 2025-04-07 18:14:11+00:00 à 2025-07-01 21:14:49+00:00 Variable temporelle (dates/heures)
updated_at_in_timezone datetime64[ns, UTC] Temporelle 0 0% 2025-04-07 18:14:11+00:00 à 2025-07-06 14:10:30+00:00 Variable temporelle (dates/heures)
misdetected_completely object Dummy/Binaire 0 0% ['f', 't'] Variable binaire textuelle (f/t )
merged object Dummy/Binaire 0 0% ['f', 't'] Variable binaire textuelle (f/t )
comment_feedback object Texte 27265 100% 32 valeurs uniques Variable texte libre

Public Transport

variable dtype type_variable missing_count missing_percent modalites description
leg_id object Identifiant 0 0% 3841 identifiants uniques Variable identifiant unique
departure_at datetime64[ns, UTC] Temporelle 0 0% 2025-04-09 10:54:18+00:00 à 2025-06-29 21:24:10+00:00 Variable temporelle (dates/heures)
departure_station_name object Texte 1 0% 623 valeurs uniques Variable texte libre
arrival_at datetime64[ns, UTC] Temporelle 0 0% 2025-04-09 11:08:02+00:00 à 2025-06-29 21:29:23+00:00 Variable temporelle (dates/heures)
arrival_station_name object Texte 0 0% 640 valeurs uniques Variable texte libre
line_number object Texte 12 0% 264 valeurs uniques Variable texte libre
departure_station object Texte 0 0% 1092 valeurs uniques Variable texte libre
arrival_station object Texte 0 0% 1095 valeurs uniques Variable texte libre

User Stats

variable dtype type_variable missing_count missing_percent modalites description
user_id object Identifiant 0 0% 50 identifiants uniques Variable identifiant unique
first_tracked_at datetime64[ns, UTC] Temporelle 0 0% 2025-04-07 00:00:00+00:00 à 2025-05-07 00:00:00+00:00 Variable temporelle (dates/heures)
latest_tracked_at datetime64[ns, UTC] Temporelle 0 0% 2025-04-12 00:00:00+00:00 à 2025-06-29 00:00:00+00:00 Variable temporelle (dates/heures)
days_in_range_count int64 Continue 0 0% Min: 2.00, Max: 81.00, Moyenne: 55.40 Variable numérique continue
active_days_count int64 Continue 0 0% Min: 2.00, Max: 81.00, Moyenne: 52.14 Variable numérique continue
max_gap int64 Continue 0 0% Min: 0.00, Max: 21.00, Moyenne: 1.72 Variable numérique continue
inactive_days_count int64 Continue 0 0% Min: 0.00, Max: 26.00, Moyenne: 3.26 Variable numérique continue
tracking_completeness float64 Continue 0 0% Min: 0.55, Max: 1.00, Moyenne: 0.94 Variable numérique continue
activated_at datetime64[ns, UTC] Temporelle 0 0% 2025-03-19 13:42:59.499000+00:00 à 2025-05-07 09:49:52.503000+00:00 Variable temporelle (dates/heures)
activated_at_in_timezone datetime64[ns, UTC] Temporelle 0 0% 2025-03-19 13:42:59+00:00 à 2025-05-07 09:49:52+00:00 Variable temporelle (dates/heures)
confirmed_days_count int64 Continue 0 0% Min: 0.00, Max: 81.00, Moyenne: 26.94 Variable numérique continue
confirmed_tracks_count int64 Continue 0 0% Min: 0.00, Max: 1825.00, Moyenne: 290.58 Variable numérique continue
created_at datetime64[ns, UTC] Temporelle 0 0% 2025-03-19 13:42:33.338000+00:00 à 2025-05-07 09:46:28.316000+00:00 Variable temporelle (dates/heures)
created_at_in_timezone datetime64[ns, UTC] Temporelle 0 0% 2025-03-19 13:42:33+00:00 à 2025-05-07 09:46:28+00:00 Variable temporelle (dates/heures)
first_tracked_at_in_timezone datetime64[ns, UTC] Temporelle 0 0% 2025-04-07 15:33:51+00:00 à 2025-05-07 16:12:05+00:00 Variable temporelle (dates/heures)
handset object Texte 0 0% 30 valeurs uniques Variable texte libre
latest_confirmed_finished_at datetime64[ns, UTC] Temporelle 9 18% 2025-04-08 18:34:46+00:00 à 2025-06-30 08:09:17+00:00 Variable temporelle (dates/heures)
latest_confirmed_finished_at_in_timezone datetime64[ns, UTC] Temporelle 9 18% 2025-04-08 18:34:46+00:00 à 2025-06-30 08:09:17+00:00 Variable temporelle (dates/heures)
latest_data_transmission_at datetime64[ns, UTC] Temporelle 0 0% 2025-04-12 12:35:53+00:00 à 2025-07-22 09:30:53+00:00 Variable temporelle (dates/heures)
latest_data_transmission_at_in_timezone datetime64[ns, UTC] Temporelle 0 0% 2025-04-12 12:35:53+00:00 à 2025-07-22 09:30:53+00:00 Variable temporelle (dates/heures)
latest_storyline_finished_at datetime64[ns, UTC] Temporelle 0 0% 2025-04-12 12:35:32+00:00 à 2025-06-30 17:03:50+00:00 Variable temporelle (dates/heures)
latest_storyline_finished_at_in_timezone datetime64[ns, UTC] Temporelle 0 0% 2025-04-12 12:35:32+00:00 à 2025-06-30 17:03:50+00:00 Variable temporelle (dates/heures)
latest_tracked_at_in_timezone datetime64[ns, UTC] Temporelle 0 0% 2025-04-12 12:35:32+00:00 à 2025-07-22 09:30:52+00:00 Variable temporelle (dates/heures)
operating_system object Dummy/Binaire 0 0% ['ios', 'android'] Variable binaire textuelle (ios/android )
os_version object Catégorielle nominale 0 0% ['iOS 15.6.1', '15', '14', 'iOS 18.3.1', 'iOS 18.1.1', 'iOS 18.5', 'iOS 18.4.1', '10', 'iOS 15.8.4', 'iOS 18.3.2'] Variable catégorielle (15 modalités)
tracks_count int64 Continue 0 0% Min: 13.00, Max: 1880.00, Moyenne: 546.66 Variable numérique continue
unconfirmed_days_count int64 Continue 0 0% Min: 0.00, Max: 81.00, Moyenne: 25.16 Variable numérique continue
unconfirmed_tracks_count int64 Continue 0 0% Min: 0.00, Max: 1062.00, Moyenne: 256.08 Variable numérique continue
weight float64 Catégorielle ordinale 0 0% [np.float64(1.0)] Variable catégorielle ordonnée (1 niveaux)
id_Gen float64 Continue 5 10% Min: 1001.00, Max: 20022.00, Moyenne: 5665.84 Variable numérique continue
commune object Dummy/Binaire 5 10% ['Ville de Carouge', 'Ville de Genève'] Variable binaire textuelle (Ville de Carouge/Ville de Genève )
anciennete_commune object Catégorielle nominale 5 10% ['plus de 10 ans', '5 à 10 ans', '2 à 5 ans', 'moins de 2 ans'] Variable catégorielle (4 modalités)
genre object Dummy/Binaire 5 10% ['F', 'H'] Variable binaire textuelle (F/H )
année_naissance float64 Continue 5 10% Min: 1952.00, Max: 1999.00, Moyenne: 1980.29 Variable numérique continue
statut_pro object Catégorielle nominale 6 12% ['tps partiel', 'Retraité·e', 'tps plein', 'chômage', 'autre', 'Autres'] Variable catégorielle (6 modalités)
abo_TP object Catégorielle nominale 5 10% ['Abonnement demi-tarif CFF', 'Abonnement général (AG) CFF', 'Abonnement de zone unireso TPG', 'Aucun', 'Abonnement de zone unireso TPG, Abonnement demi-tarif CFF', ' Abonnement demi-tarif CFF', 'Abonnement de parcours CFF', 'Abonnement de zone unireso TPG, Abonnement de parcours CFF', 'Abonnement demi-tarif CFF, Abonnement de zone unireso TPG'] Variable catégorielle (9 modalités)
possessions object Catégorielle nominale 5 10% ['Aucun', ' Vélo conventionnel (mécanique)', 'Vélo à assistance électrique', 'Vélo conventionnel (mécanique)', 'Vélo à assistance électrique, Vélo conventionnel (mécanique)'] Variable catégorielle (5 modalités)
ouverture à l'évolution des pratiques modales object Dummy/Binaire 5 10% ['Oui tout à fait', 'Plutôt oui'] Variable binaire textuelle (Oui tout à fait/Plutôt oui )
structmen 65+ float64 Catégorielle ordinale 5 10% [np.float64(0.0), np.float64(1.0), np.float64(2.0)] Variable catégorielle ordonnée (3 niveaux)
structmen 26-64 float64 Catégorielle ordinale 5 10% [np.float64(0.0), np.float64(1.0), np.float64(2.0)] Variable catégorielle ordonnée (3 niveaux)
structmen 18-25 float64 Dummy/Binaire 5 10% [np.float64(0.0), np.float64(1.0)] Variable binaire numérique (0.0/1.0 )
structmen 16-17 float64 Dummy/Binaire 5 10% [np.float64(0.0), np.float64(1.0)] Variable binaire numérique (0.0/1.0 )
structmen 0-15 float64 Catégorielle ordinale 5 10% [np.float64(0.0), np.float64(1.0), np.float64(2.0), np.float64(3.0)] Variable catégorielle ordonnée (4 niveaux)
equipement menage motos float64 Catégorielle ordinale 5 10% [np.float64(0.0), np.float64(1.0), np.float64(2.0), np.float64(3.0)] Variable catégorielle ordonnée (4 niveaux)
freq_moto object Catégorielle nominale 5 10% ['Une à plusieurs fois par semaine', 'Moins d’une fois par semaine', 'Tous les jours ou presque'] Variable catégorielle (3 modalités)
equipement menage voitures float64 Catégorielle ordinale 5 10% [np.float64(0.0), np.float64(1.0), np.float64(2.0)] Variable catégorielle ordonnée (3 niveaux)
freq_voiture object Catégorielle nominale 5 10% ['Moins d’une fois par semaine', 'Une à plusieurs fois par semaine', 'Tous les jours ou presque'] Variable catégorielle (3 modalités)
freq_accompagnements object Catégorielle nominale 38 76% ['Une à plusieurs fois par semaine', 'Moins d’une fois par semaine', 'Tous les jours ou presque'] Variable catégorielle (3 modalités)
bad_signal_user int64 Catégorielle 0 0% [np.int64(0)] Variable catégorielle (1 modalités)

Journey

variable dtype type_variable missing_count missing_percent modalites description
journey_id object Identifiant 0 0% 5151 identifiants uniques Variable identifiant unique
user_id object Identifiant 0 0% 49 identifiants uniques Variable identifiant unique
started_at datetime64[ns, UTC] Temporelle 0 0% 2025-04-08 07:57:55+00:00 à 2025-06-28 22:29:27+00:00 Variable temporelle (dates/heures)
finished_at datetime64[ns, UTC] Temporelle 0 0% 2025-04-08 18:34:46+00:00 à 2025-06-29 10:10:34+00:00 Variable temporelle (dates/heures)
main_mode object Texte 0 0% 22 valeurs uniques Variable texte libre
modes object Texte 0 0% 1526 valeurs uniques Variable texte libre
long_distance bool Dummy/Binaire 0 0% [np.False_, np.True_] Variable binaire (True/False)
trips_count Int64 Autre 0 0% 27 valeurs uniques Type de données: Int64
tracks_count Int64 Autre 0 0% 51 valeurs uniques Type de données: Int64
tracks_count_without_walks Int64 Autre 0 0% 29 valeurs uniques Type de données: Int64
main_purpose object Catégorielle nominale 2414 47% ['Leisure', 'Shopping', 'Eat out', 'Errand', 'Family & Friends', 'Sports', 'Unknown', 'Waiting', 'Working', 'Medical visit'] Variable catégorielle (13 modalités)
duration Int64 Autre 0 0% 4113 valeurs uniques Type de données: Int64
distance Int64 Autre 0 0% 3934 valeurs uniques Type de données: Int64
created_at datetime64[ns, UTC] Temporelle 0 0% 2025-04-09 07:49:26+00:00 à 2025-07-06 14:09:11+00:00 Variable temporelle (dates/heures)
main_purpose_mrmt object Catégorielle nominale 0 0% ['Loisir', 'Tout motifs', 'Achat et services', 'Travail', 'Accompagnement', 'Formation'] Variable catégorielle (6 modalités)
main_mode_niv1 object Catégorielle nominale 0 0% ['Marche', 'TP', 'Vélo', 'Voiture', 'Autres'] Variable catégorielle (5 modalités)
modes_niv1 object Texte 0 0% 1252 valeurs uniques Variable texte libre
journey_origin_canton object Catégorielle nominale 0 0% ['GE', 'VD', 'FR', 'ZH', 'HorsCHE', 'LU', 'VS', 'BE', 'TI', 'NE'] Variable catégorielle (11 modalités)
journey_destination_canton object Catégorielle nominale 0 0% ['GE', 'VD', 'FR', 'ZH', 'HorsCHE', 'LU', 'VS', 'BE', 'TI', 'NE'] Variable catégorielle (11 modalités)