Comment gérez-vous les projets de « Big Data » avec SQL Server...

Comment gérez-vous les projets de « Big Data » avec SQL Server 2016 ?

by -
0 235

Polybase comble l'écart relationnel – Big Data

Comment gérez-vous les projets de « Big Data » avec SQL Server 2016 ?

Le Big Data semble vraiment effrayant. Il évoque l’image d’un tsunami de fichiers, de toutes tailles et formes, balayant le paysage et engloutissant l’environnement que nous avions mis des années à mettre en ordre. Le Big Data inclut tout, des fichiers vidéo massifs, aux médias sociaux jusqu’aux minuscules lectures de température envoyées par des capteurs sur une machine.

Donner du sens au Big Data est un défi de taille. Beaucoup de gens verront cela comme une opportunité. C’est ce qu’ils diront en public, mais rares sont les personnes qui relèvent le défi des data scientists, même si les récompenses peuvent être spectaculaires. En privé, tout le monde est aussi angoissé par le Big Data que par l’Internet des objets, créateur de toutes ces nouvelles informations.

En vérité, les avantages promis par le Big Data se font toujours attendre, mais il est peut-être encore trop tôt pour en juger. Habituellement, lorsqu’une nouvelle technologie atteint un plateau, elle a besoin d’un booster pour passer au niveau suivant.

Ce boost peut être provoqué par SQL Server 2016. Mais ces bases de données relationnelles, avec leur organisation strictement réglementée, sont-elles appropriées pour l’enchevêtrement de données typique d’un projet Big Data ? Jusqu’à présent, le compromis le plus proche consistait à utiliser des bases de données NoSQL qui pouvaient accueillir plus de diversité.

Cependant, les projets Big Data utilisent des systèmes comme HDInsight ou Hadoop de Microsoft et ils finissent par être intégrés à des données existantes provenant de bases de données relationnelles ou d’entrepôts de données.

C’est là qu’une nouvelle fonctionnalité de SQL Server 2016, appelée PolyBase, fait toute la différence. PolyBase agit comme un pont entre les systèmes de données relationnelles et d’entreposage de données bien disciplinés de SQL Server, et le mélange anarchique de bases de données comme Hadoop. PolyBase n’est pas nouveau, mais son niveau d’efficacité l’est. Une fois confiné dans l’entrepôt de données SQL Server Parallel Data Warehouse, il n’était utilisé que par les plus grandes organisations. L’inclusion de PolyBase dans la gamme principale de SQL Server 2016 ouvre la voie du Big Data à toutes les installations SQL Server 2016.

PolyBase vous redonne le contrôle. Il vous permet d’utiliser vos outils SQL Server existants comme SSMS et T-SQL pour interroger les magasins Big Data. Il ouvre des portes dans les clusters Hadoop précédemment inaccessibles et vous permet même d’écrire des requêtes qui joignent ce Big Data semi-structuré à des tables dans les bases de données relationnelles SQL Server. Il permet de récupérer des données provenant de sources externes telles que les versions Cloudera et Hortonworks de Hadoop et Azure Blob Storage par exemple. Microsoft indique qu’il ajoutera des sources de données à l’avenir.

Utiliser PolyBase, c’est comme utiliser un serveur lié. La technologie PolyBase est transparente pour l’application et les sources de données externes sont incorporées dans le schéma de base des données.

Au final, alors qu’il menaçait d’échapper à tout contrôle, le Big Data devient accessible. Le service d’urgence qui vient à votre secours s’appelle PolyBase et il est véhiculé par Microsoft SQL Server 2016.

I am the Group Chief Marketing Officer at Crayon. My team are focused on driving enhanced lead generation campaigns and nurturing for our sales organisations across multiple geographies though the utilisation and coordination of all online and offline communication channels. We are driving increased brand awareness in the business's core competency areas of Software Asset Management (SAM), cloud and volume licensing solutions and associated consultancy services. I have over 20 years of senior business leadership experience within direct marketing/direct sales and mass distribution businesses, in both the B2B and B2C markets serving on the boards of both private and public multinational corporations.