Démarche datamining, Vapiano, big data, dimensions 3V, données numériques, supercalculateurs, algorithmes, cloud, Citymapper, data centers, économie numérique, smartgrids, CNIL, fraudes, cadre juridique, collecte d'informations
Apparu en octobre 1997, le terme de "mégadonnées" ou "grosses données" désigne l'ensemble des grands volumes de données et vient de l'explosion massive des données générées sur le web. Les données viennent majoritairement d'internet, mais aussi d'autres supports comme les serveurs de stockage, les clés USB, les CD, DVD et Blu-ray. Nous en créons des quantités énormes chaque jour par notre présence sur les réseaux sociaux, notre géolocalisation, nos photos et vidéos, etc. Le Big Data s'exprime également au travers de trois dimensions appelées les "3V".
[...] Ils ont ainsi appris à déceler des signes avant-coureurs de tentatives de suicide, d'épidémie d'Ebola ou de gastro". Cette veille sanitaire ne serait pas aussi efficace sans toutes ces données récoltées puis analysées Les laboratoires pharmaceutiques Ces mêmes données (toujours dans le secteur de la santé) sont exploitées par les grands laboratoires pharmaceutiques tels que Sanofi, Pierre-Fabre et Pfizer afin de prédire et d'identifier les pathologies de nombreux patients. Ainsi, ils peuvent rapidement se concentrer sur la recherche et la réalisation de traitement pour y remédier. C. [...]
[...] Le nombre d'ateliers par an sera constant et chaque participant sera nouveau. Ces données seront obtenues via un processus dit “déclaratif” et de « First Party Data » (données directement collectées par l'entreprise sur ses clients), c'est-à-dire qu'elles seront récoltées directement à partir de déclarations de personnes. Elles serviront essentiellement à qualifier le profil client et à améliorer le ciblage. C. Les modalités de collecte des informations - Lors des ateliers organisés : collecte des informations sur papier à la caisse du restaurant (remplissage obligatoire) Utilisation du logiciel ORANGE afin de collecter les données des clients. [...]
[...] Mise en œuvre d'une démarche datamining – Le cas de Vapiano I. Note de synthèse sur le Big Data et DataMining A. Origine et présentation du « phénomène » Big Data Apparu en octobre 1997, le terme de « mégadonnées » ou « grosses données » désigne l'ensemble des grands volumes de données et vient de l'explosion massive des données générées sur le web. Il est possible de trouver plusieurs définitions du Big Data telles que : - « Données de très grande taille, dont la manipulation et gestion présentent des enjeux du point de vue logistique » d'après le dictionnaire Oxford English ; - « Englobe tout terme pour décrire toute collection de données tellement volumineuse et complexe qu'il devient difficile de la traiter en utilisant des outils classiques de traitement d'applications » selon Wikipédia ; - « Domaine technologique dédié à l'analyse de très grands volumes de données informatiques (pétaoctets), issus d'une grande variété de sources, tels les moteurs de recherche et les réseaux sociaux ; ces grands volumes de données. [...]
[...] Les possibilités sont multiples et s'appliquent à une infinité de secteurs. Le datamining de masses de données est par exemple très performant pour détecter les fraudes. En analysant quantité de données sur des populations de fraudeurs, on découvrira certains profils types qui n'étaient pas “visibles”. Il est alors possible de mieux cibler les contrôles (l'administration douanière française commence à utiliser ces technologies). L'analyse des masses de données permet plus spécifiquement d'anticiper, avec un certain degré de certitude, des comportements ou des besoins. [...]
[...] La prévention des crimes est l'une des applications possibles de l'analyse des masses de données. E. L'environnement juridique Le cadre juridique des données numériques est essentiellement constitué d'obligations : obligations déclaratives liées au traitement des données personnelles, obligations d'acheminement des données, obligations de conservation et de communication des données pour le compte des autorités judiciaires et même, parfois, obligations de mise à disposition des données publiques. Au niveau des droits, la capacité́ juridique à réutiliser, à agréger et à valoriser les gisements de données détenues ou produites fait débat. [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture