Détails du projet
Préambule
peut-être avez-vous entendu parler d'intelligence artificielle ? et de deep-learning (apprentissage profond en français) ?
peut-être savez-vous qu'il existe des outils libres qui permettent de mettre en oeuvre ces technologies ...
peut-être savez vous que pour ça les cartes vidéo de joueurs peuvent-être mises à contributions (enfin, leur GPU, nvidia en particulier) ?
Et comme j'ai eu envie de prendre ça en main, de creuser et de "monter en compétence" sur ce sujet ... j'ai cherché à faire un truc assez petit pour que ça soit "simple" et avec les moyens du bord, pas de carte vidéo de joueur, une vieille nvidia gtx 960 (tant pis ça moulinera des semaines s'il le faut mais je ne vais pas claquer plus de 1000€ dans une carte vidéo)
et en regardant ce que j'avais autour de moi je suis tombé sur mes tickets de carburant, le délire est donc de prendre des tickets, de dire ce qui est intéressant dessus (exemple la date, le type de carburant et le volume de carburant acheté), ensuite de donner beaucoup (mais alors vraiment beaucoup) de tickets à "manger" au moteur d'apprentissage profond et ensuite de voir s'il est capable d'extraire tout seul des données de tickets "inconnus" ...
vous allez me dire qu'on peut faire la même chose avec de l'OCR et des expressions régulières ? oui, mais ça je sais déjà le faire
donc j'ai avancé sur cette idée, je me suis plongé dans tensor flow (et wikipédia) et j'ai injecté mes 10 facturettes dans le moteur pour voir ... bon c'est prometteur mais très largement insuffisant, par exemple pour classifier des images on parle d'une base de plusieurs milliers de photos, cf https://www.tensorflow.org/tutorials/images/classification
Donc il faut que je collecte beaucoup, mais vraiment beaucoup de facturettes de carburant pour que je puisse progresser ...
Envoyez vos tickets
Allez sur la page d'accueil avec votre smartphone et cliquez sur le bouton pour prendre en photo votre ticket, cadrez bien, dès que la photo est prise le fichier est téléversé sur le serveur
Exemple de photo souhaitée
Voici un exemple de photo correctement prise : pas d'effet de perspective, la totalité de l'image est nette, le papier n'est pas froissé, il n'y a pas d'ombres, tout est clairement lisible.
Anonymat "complet"
Attention, sur certains tickets les 4 derniers chiffres de votre numéro de CB sont affichés (comme par exemple sur la photo ci-jointe: 0970). C'est un élément qui pourrait être utilisé à des fins de "tracking" surtout si on est peu nombreux à contribuer à cette base de données (plus on est nombreux et plus il est probable que d'autres utilisateurs ayant le même numéro final de CB participent dilluant ainsi votre "signature" dans la masse). Vous pouvez donc passer un coup de feutre noir sur ces 4 chiffres avant de prendre la photo si vous le souhaitez.
Dans le pire des cas si vous laissez ce code apparent on pourrait dire que '0970' était au Carrefour de Quetigny le 8 janvier 2021 à 12h50 ... ce qui dans un monde ultra connecté (et où le croisement de données informatiques est sensé être interdit) pourrait être utilisé à votre encontre.
Méta données des photos
Avant d'être proposées au téléchargement public les méta données des photos sont supprimées à l'aide de la commande suivante
exiftool -all= -overwrite_original photo.jpg
Diffusion de la base de données
Cette collection de photo de tickets sera diffusée (après modération pour éviter tout problème) sur la page Téléchargements
Mentions Légales
Le site carbu.org est conçu, réalisé, édité et hébergé par : CAP-REL SAS, référez-vous aux mentions légales du site cap-rel.fr pour plus de détails.
Politique de protection des données
Le site carbu.org ne collecte aucune donnée personnelle. Les photos des tickets de carburants que vous envoyez sont anonymes et seront traités de manière complètement anonyme. Votre adresse IP sera temporairement stockée dans les journaux système du serveur selon les obligations légales en vigueur et rien d'autre.
Autre chose ?
En vérité je n'ai aucune idée des détails que vous voudriez trouver ici alors le plus simple c'est de m'envoyer un mail (adresse: vroum at carbu point org) pour m'aider à écrire cette page en listant ce que vous auriez aimé y trouver !