Voitures autonomes

Un ensemble de données obsolètes sur les voitures autonomes témoigne de l'évolution de l'apprentissage automatique

Un ensemble de données obsolètes sur les voitures autonomes témoigne de l'évolution de l'apprentissage automatique

Alors que les voitures autonomes deviennent une réalité sur la voie publique, toutes les données et informations responsables de leur conduite en toute sécurité doivent être enregistrées.

C'est pourquoi, lorsque le message s'est répandu que les étiquettes de centaines de piétons, de cyclistes, de cônes de signalisation, entre autres, manquaient dans un ensemble de données largement utilisé pour les voitures autonomes, l'inquiétude a été la principale réaction. Après tout, les «règles de la route» ne tiennent pas compte des voitures autonomes avec des angles morts qui incluent des humains.

Mais ce n'est pas, en fait, le cas.

VOIR AUSSI: COMMENT FONCTIONNENT LES VOITURES AUTO-CONDUITE?

L'apprentissage automatique évolue, comme le montrent les anciens ensembles de données

Hors de 15,000 images vérifiées manuellement à partir du jeu de données Udacity 2, 4,986 d'entre eux, c'est 33%, étaient incomplètes, selon le fournisseur de jeux de données commercial, Roboflow.ai. Mais les ensembles de données d'Udacity ont été créés il y a plus de trois ans et ne sont pas actifs sur la voie publique.

Il est important de se rappeler: dans les années d'apprentissage automatique sur Internet, trois années humaines, c'est il y a plusieurs vies.

"Dans les années qui ont suivi", a déclaré Udacity à Interesting Engineering (IE) dans un échange de courriers électroniques, "des sociétés comme Waymo, nuTonomy et Voyage ont publié des ensembles de données plus récents et de meilleure qualité destinés à des scénarios du monde réel."

En d'autres termes, Udacity n'a pas activement créé de nouveaux ensembles de données pour suivre la dernière ligne d'ensembles de données sur les voitures autonomes car - pour l'instant - il a cédé le plancher du monde réel des rues publiques aux nouvelles entreprises.

Apprentissage automatique et algorithmes

L'apprentissage automatique a aidé de nombreuses industries à évoluer au-delà de leur état actuel. L'enseignement des algorithmes informatiques pour effectuer de nouvelles tâches est nécessaire pour que ce processus fonctionne correctement et en toute sécurité. Sur une chronologie suffisamment longue, ces ensembles de données deviennent extrêmement complexes. Cela peut les rendre difficiles à comprendre pour les personnes au début de leur carrière de conduite autonome. C'est pourquoi les ensembles de données incomplets - comme un «mode facile» dans un jeu vidéo - ne sont pas une mauvaise idée. Tant qu'ils restent hors route.

Les voitures autonomes nécessitent beaucoup de données pour que leurs algorithmes puissent naviguer dans les dangers des voies publiques. Si une voiture ne sait pas reconnaître un piéton humain marchant sur le bord de la route ou un cycliste partageant la route avec la voiture, de graves problèmes peuvent survenir.

Le fournisseur de jeux de données commerciaux, Roboflow, a publié un article confirmant qu'un jeu de données populaire sur les voitures autonomes manquait effectivement de mises à jour. Le jeu de données Udacity 2 est utilisé par milliers des étudiants qui créent un ensemble de données open source sur les voitures autonomes.

La société Roboflow vérifiée à la main 15 000 images à partir de l'ensemble de données, et a découvert que 33% d’entre eux avaient des problèmes. Il y avait milliers de véhicules non étiquetés, des centaines de piétons non étiquetés, et douzaines de cyclistes non étiquetés.

Roues d'entraînement pour les ensembles de données de voiture autonome

Roboflow n'a peut-être pas eu l'intention d'induire le public en erreur. Le concept des roues d'entraînement est difficile à comprendre pour tout le monde. Un vélo est-il toujours un vélo, si la fille qui le monte a deux roues supplémentaires? En quelque sorte, mais pas exactement. Vive-t-elle ce que c'est que de faire du vélo? Certainement, mais sans le risque réel de chute potentielle.

Est-elle prête pour la vraie chose?

C'est à elle, et on pourrait dire la même chose des étudiants, qui doivent décider s'ils sont prêts à décoller les roues d'entraînement et à construire leurs propres ensembles de données dans le risque réel de l'industrie.

Bien sûr, à partir de l'ensemble de données d'Udacity, ces étudiants auraient un long chemin à parcourir. Les identifications manquantes suivies par Roboflow comprenaient des cadres de délimitation dupliqués, des cadres de délimitation surdimensionnés et des annotations fantômes.

Pour compliquer les choses, autour 1.4% des images n'étaient tout simplement pas activées, mais elles contenaient des voitures, des camions, des lumières et même des piétons - comme une invitation aux développeurs de jeux de données de demain, à remplir les données pour eux-mêmes.

Cela montre à quel point les ensembles de données open source sont incroyablement complexes, et cet écart entre les routes du monde réel et les premiers ensembles de données est un crédit pour les entreprises de jeux de données de pointe avec des véhicules sur les routes publiques. Mais le jeu de données sur les voitures autonomes d'Udacity n'est pas utilisé sur les routes publiques. À l'heure actuelle, la seule voiture autonome d'Udacity est à usage éducatif uniquement, installée sur une piste d'essai fermée.

Les étudiants qui ont besoin d'une feuille de triche - dans leur ambition de combler les trous d'un jeu de données vieux de trois ans - ont de la chance: Roboflow a corrigé et réédité le jeu de données, ici.

À mesure que l'apprentissage automatique pousse la technologie des voitures autonomes à créer des ensembles de données plus fidèles, il deviendra plus facile de regarder en arrière au fil des années et des décennies et de se demander comment nous avons géré.

Mais, tout comme la fille et son vélo, le défi consiste à retirer les roues d'entraînement et à se frayer un chemin sur la voie publique.

*** Note de la rédaction: cet article a été mis à jour - avec plusieurs modifications apportées tout au long - après avoir reçu des éclaircissements d'Udacity. Une version antérieure de cet article impliquait que les ensembles de données sur les voitures autonomes d'Udacity étaient activement utilisés dans les rues publiques. Cela a été corrigé pour refléter le fait que les données de l'entreprise ne sont utilisées qu'à des fins éducatives, et ne sont en fait pas plus imparfaites que les «roues d'entraînement», et ne sont utilisées que pour aider les développeurs de jeux de données ambitieux à se familiariser avec la technologie. De plus, Udacity n'a pas développé de nouveaux ensembles de données depuis trois ans, et a "cédé la parole" à des ensembles de données plus récents et plus avancés fournis par d'autres sociétés non affiliées. De plus, la seule voiture autonome d'Udacity en service est exclusivement à des fins éducatives et fonctionne sur une piste d'essai fermée, pas sur des voies publiques. Dans l'ensemble, la version précédente de cet article suggérait que les ensembles de données incomplets développés par Udacity étaient des erreurs, ce qui est une mauvaise interprétation du fait que les anciens ensembles de données apparaîtront naturellement comme des erreurs, avec le recul des développements futurs. Enfin, le titre original de cet article a été modifié pour refléter cela. IE regrette ces erreurs.

-IE Éditorial ***


Voir la vidéo: Reportage - Comment la voiture autonome veut se développer en France (Novembre 2021).