Address

1410 Rue Stanley
Suite 606
Montreal, QC H3A 1P8
Canada


122 East 42nd Street
Suite 2005
NY, NY 10168
USA

 

Email

info@datacratic.com

Adresse

1410 rue Stanley 606
Montréal, QC H3A 1P8


122 East 42nd Street
Suite 2005
NY, NY 10168
USA

 

Courriel

info@datacratic.com

 

Location map

Contactez-nous

Comment pouvons-nous vous contacter?
http://
Votre soumission, excluant les informations personnelles, sera analysée par un détecteur de pourriels. En envoyant ce formulaire, vous acceptez la politique de confidentialité de Mollom.

Contactez-nous

La Plateforme Datacratic

Le cœur de la technologie Datacratic est basé sur une plateforme d'apprentissage-machine automatique qui entraîne et exécute des modèles prédictifs. Soutenue par une structure complexe de gestion des flux de données en temps réel qui garantit que les données pertinentes sont disponibles au bon moment, la plateforme analyse dans un premier temps la structure des données, puis en extrait les caractéristiques principales pour les modèles prédictifs.

La plateforme Datacratic sépare le signal du bruit en temps réel et utilise ensuite les signaux les plus pertinents comme vecteurs de caractéristiques pour entraîner des modèles prédictifs utilisant plusieurs algorithmes d'apprentissage-machine.

La plateforme tire profit de plusieurs algorithmes d'apprentissage-machine, qu’ils soient publiés, propriétaires ou à code source ouvert. La plupart du temps, nous redessinons complètement les algorithmes en mettant l'accent sur leurs applications dans le monde réel. Les performances en temps réel étant primordiales, nous avons conçu nos vecteurs de caractéristiques pour qu’ils fonctionnent de manière optimale. Il nous arrive fréquemment de remplacer l’implémentation rigoureuse d’un algorithme lent par une implémentation approximative qui fournit 90% de la valeur et qui opère des centaines ou des milliers de fois plus rapidement. La plateforme est insérée dans une infrastructure de simulation et d’entraînement qui entraîne des modèles non-biaisés et en mesure la performance en utilisant un ensemble de données réelles. La capacité unique du Bidder Datacratic de simuler des campagnes RTB sous différents modèles vient de cette infrastructure.

La plateforme Datacratic permet l’intégration facile de nos produits aux plateformes de nos clients par des connecteurs E/S liés à des flux de données différents, tout en assurant la sécurité de ces dernières. Chez Datacratic, nous développons des solutions techniques élégantes qui maximisent l'utilité des flux de données en temps réel. Notre technologie permet une régularité dans le traitement des données qui échappe à la concurrence. Nous croyons que c’est ce qui fait toute la différence dans le monde réel.

 

LA DIFFÉRENCE DATACRATIC

Mise à jour en temps réel

La plateforme Datacratic prend en compte automatiquement les nouvelles sources de données qui lui sont présentées, ce qui permet une mise à jour de modèles en temps réel à chaque fois qu'une nouvelle source de données est introduite.

Simulation de différents scénarios

Notre plateforme fournit un environnement de modélisation riche et productif qui peut être exploité pour fournir des scénarios spéculatifs de test et de contrôle a posteriori parce que nos opérations de modélisation sont réalisées au moyen de simulations qui peuvent être exécutées avec une parfaite fidélité.

Modèles hautement compressés

Les sources de données et les modèles sont hautement compressés et demeurent en tout temps sur une seule et même machine, comme c’est le cas pour les plateformes de transactions financières.

 

Extensibilité massive

L'architecture axée sur les performances de la plateforme Datacratic est conçue et développée pour permettre la meilleure extensibilité massive possible à travers coeurs de processeurs et machines.

 

Modèles économiques

Des modèles économiques sont utilisés tout au long du processus, assurant ainsi une évaluation adéquate des données.

Apprentissage en ligne/hors-ligne

Les modèles prédictifs de Datacratic sont conçus pour fonctionner dans un mode d'apprentissage en ligne/hors-ligne hybride : adaptation en ligne et ré-entraînement périodique hors-ligne. La plateforme Datacratic n'est pas une boîte noire : elle inclut des outils pour visualiser et comprendre ce qui motive le comportement des modèles.

 
Comment ça marche :

 
Données Client
Datacratic ne possède pas de données propriétaire. La plateforme importe les données client, que ce soit par lot ou en temps réel.
Acquisition de données et importation (ETL)
Binaire, json ou xml; la plateforme importe les données, quelle que soit la façon dont elles ont été générées. Les points d’écoute à haute performance en temps réel peuvent prendre en charge des centaines de milliers d’évènements à la seconde et faire évoluer le système par le simple ajout de nouveaux serveurs.
Magasin de données
Les données sont stockées dans un format conçu pour optimiser les performances mémoire et CPU. L'extraction de caractéristiques est conçue pour s’effectuer directement dans les conteneurs de données afin que les algorithmes soient exécutés sur une très grande quantité de données facilement et de manière efficace. Cela permet de traiter les données brutes bruyantes et de nettoyer le signal dès l’arrivée des données dans le magasin.
Modélisation
La première étape de l'apprentissage automatique est la modélisation, pendant laquelle les données sont analysées. Les caractéristiques en sont extraites ou rejetées en fonction de leur valeur en termes de prédiction du résultat final.
Entraînement de modèle
Avec un ensemble de vecteurs caractéristiques propres, la plateforme est en mesure d’entraîner les modèles de façon non biaisée. Plusieurs modèles sont entraînés en parallèle, et différentes combinaisons d’hyperparamètres possibles sont explorées. Le modèle le plus performant est alors envoyé en production.
Simulation et validation
Tous les modèles générés par la plateforme sont passés au crible de la validation croisée et de la simulation pour se protéger contre le surentraînement et s'assurer que les performances du monde réel sont similaires aux performances obtenues lors de l’entraînement. De nouvelles sources de données sont introduites à cette étape et leur valeur est déterminée avant leur exploitation en production.
Modèle final
Le résultat final est un modèle de haute performance auto-généré mis à profit pour effectuer des prédictions. Les modèles sont disponibles en tant que service à intégrer aux produits de Datacratic.
Production
Des modèles prédictifs propulsent trois suites logicielles de Datacratic et peuvent également être mis à profit dans plusieurs autres contextes. La plateforme a été conçue pour une intégration flexible à d'autres systèmes et plateformes.

Les modèles prédictifs de Datacratic sont conçus pour fonctionner dans un mode d'apprentissage en ligne/hors-ligne hybride : adaptation en ligne et ré-entraînement périodique hors-ligne. La plateforme Datacratic n'est pas une boîte noire : elle inclut des outils pour visualiser et comprendre ce qui motive le comportement des modèles.