• La datavisualisation est l'art de représenter des données, parfois complexes, sous formes graphiques pour les rendre plus claires et lisibles. Elle est largement utilisée par les médias et les entreprises pour optimiser leur communication, interne ou externe. Enrichi à l'occasion de cette nouvelle édition, destiné aux étudiants comme aux professionnels, ce manuel aborde toutes les étapes, du brief à la livraison, de la conception et de la réalisation d'une datavisualisation, qu'elle soit print ou animée. Il vous permet d'entrer dans l'univers de la visualisation de données, de découvrir les ressources disponibles, d'acquérir les fondamentaux du design d'information et de les mettre en pratique, à travers de nombreux exemples, études de cas et témoignages d'acteurs reconnus de ce domaine.

  • Un ouvrage de référence pour les (futurs) data scientists

    Les bibliothèques, les frameworks, les modules et les boîtes à outils sont parfaits pour faire de la data science. Ils sont aussi un bon moyen de plonger dans cette discipline sans la comprendre. Dans cet ouvrage, vous apprendrez comment fonctionnent les outils et algorithmes les plus fondamentaux de la data science, en les réalisant à partir de zéro.

    Si vous êtes fort en maths et que vous connaissez la programmation, l'auteur, Joel Grus, vous aidera à vous familiariser avec les maths et les statistiques qui sont au coeur de la data science et avec les compétences informatiques indispensables pour démarrer comme data scientist. La profusion des données d'aujourd'hui contient les réponses aux questions que personne n'a encore pensé à poser. Ce livre vous enseigne comment obtenir ces réponses.

    La deuxième édition, revue et augmentée, de cet ouvrage comporte des codes et exemples associés entièrement réécrits en Python 3.6 et intègre de nouveaux chapitres sur l'apprentissage profond (deep learning), les statistiques et le traitement en langage naturel.


    Suivez un cours accéléré de Python.

    Apprenez les fondamentaux de l'algèbre linéaire, des statistiques et des probabilités, et comprenez comment et quand les utiliser en data science.

    Collectez, explorez, nettoyez, bricolez et manipulez les données.

    Plongez dans les bases de l'apprentissage automatique.

    Implémentez des modèles comme les k plus proches voisins, la classification naïve bayésienne, les régressions linéaire ou logistique, les arbres de décision, les réseaux neuronaux et le clustering.

    Explorez les systèmes de recommandation, le traitement du langage naturel, l'analyse de réseau, MapReduce et les bases de données.


    À qui s'adresse cet ouvrage ?


    Aux développeurs, statisticiens, étudiants et chefs de projet ayant à résoudre des problèmes de data science.

    Aux data scientists, mais aussi à toute personne curieuse d'avoir une vue d'ensemble de l'état de l'art de ce métier du futur.

  • La conception des algorithmes : une science !

    L'algorithmique est l'art et la science de concevoir des algorithmes corrects et efficaces. Pour beaucoup d'informaticiens, c'est l'aspect artistique qui prédomine : on cherche l'idée lumineuse, la structure cachée, la réponse astucieuse. Mais la conception des algorithmes est d'abord une science dont il faut posséder les bases et les techniques avant d'exprimer sa créativité. Ce livre invite le lecteur à une approche rigoureuse de la construction d'algorithmes. Il explique comment la même idée peut se retrouver dans plusieurs algorithmes correspondant à des problèmes différents. Il donne les outils pour analyser rationnellement un problème, le classer dans une famille de méthodes et produire une solution exacte.

     

    Un manuel de référence sur la construction raisonnée des algorithmes

    Dans chaque chapitre de ce livre, les bases théoriques et techniques sont rappelées et illustrées par des exemples. On y trouve ensuite un grand nombre d'exercices, accompagnés d'une correction minutieuse et complète. De la sorte, on y voit comment une démarche rationnelle permet d'atteindre une solution, exacte par construction, à travers une grande variété de cas. Après des rappels sur le raisonnement, les structures de données et la complexité, le livre parcourt les grandes méthodes de construction d'algorithmes : invariants, récursivité, essais successifs, méthodes PSEP, algorithmes gloutons, diviser pour régner, programmation dynamique. Au total, près de 150 exemples d'algorithmes sont ainsi analysés et construits rigoureusement.

    Cet ouvrage, pour sa troisième édition, a été entièrement revu et corrigé. Nombre d'exercices ont été remaniés, certains assez largement, en visant une meilleure gradation des difficultés et une argumentation plus complète.

     

    À qui s'adresse ce livre ?

    o Aux étudiants et enseignants en science informatique

    o Aux ingénieurs, enseignants-chercheurs, informaticiens et industriels

     

    La 1re édition de Conception d'algorithmes a été finaliste du prix Roberval 2017.

  • Pratique de la data science avec R ; arranger, visualiser, analyser et présenter des données Nouv.

    Le scientifique des données doit maîtriser plusieurs outils informatiques permettant de mettre en œuvre une méthodologie statistique. Dans sa catégorie, le langage R est un langage de programmation qui peut tout à fait être un outil pertinent pour l’analyse statistique de données, à côté d’autres langages de programmation ou d'autres logiciels.Cet ouvrage s'adresse tant à des étudiants de master en statistique et/ou master big data qui font leurs premiers pas en data science, qu'à des ingénieurs qui souhaitent approfondir leurs connaissances et mettre en œuvre leurs compétences à l'aide de R, en reprenant les différentes étapes du cycle de vie d'un projet basé sur l’analyse statistique de données : la préparation des données, la transformation des données, la visualisation des données, l'analyse des données et enfin, l'étape ultime, la diffusion des résultats de l'analyse.

  • Un livre à la fois théorique et pratique

    Cet ouvrage a pour ambition de couvrir un large spectre du domaine des data sciences. Il va plus loin qu'un simple tour sur les algorithmes d'apprentissage automatique et s'attaque aux autres aspects, malheureusement négligés mais fondamentaux pour tout data scientist :


    concepts généraux mais poussés, dont la maîtrise est indispensable ;

    algorithmes d'apprentissage automatique les plus connus ;

    aspects liés à l'exploration des données ;

    mesures de performances et d'autres métriques utilisées par les algorithmes ;

    différents concepts fondamentaux en mathématiques à connaître pour mieux explorer et comprendre les données ;

    notions importantes des big data ;

    études de cas pratiques en langage Python.


    La première partie de ce livre est théorique et adopte un format questions/réponses qui présente plusieurs avantages, dont la possibilité pour le lecteur de lire distinctement chacune des questions pour parfaire son savoir. Un autre point fort de cette structure est qu'elle incite à entrer dans un dialogue. Ainsi, grâce aux questions posées, le lecteur est poussé vers une réflexion où il confronte ses réponses à celles données par le livre.

    La deuxième partie est pratique et propose deux exemples d'implémentation de modèles d'apprentissage automatique. Vous y trouverez des codes écrits en Python et un aperçu de différentes difficultés que peut rencontrer un spécialiste lors de l'exercice de son métier.

    À qui s'adresse cet ouvrage ?

    Le présent ouvrage est adapté à toute personne ayant une certaine maîtrise de la data science et du Machine Learning. Il aidera notamment à se rappeler des concepts importants, mais suppose que le lecteur soit initié sur le sujet. Il sera particulièrement utile à ceux qui veulent se préparer pour un concours, un examen ou un entretien.


  • Concevoir une base de données à l'aide d'UML ou d'un formalisme entité-association

    S'adressant aux architectes logiciels, chefs de projet, analystes, développeurs, responsables méthode et étudiants en informatique, cet ouvrage explique comment

  • Pour maîtriser PostgreSQL, rien de mieux que de comprendre son fonctionnement interne. C'est ce que vous proposent Guillaume Lelarge et Julien Rouhaud avec ce livre sans équivalent, pas même en anglais. Dans un style clair et précis, ils vous expliquent en détail la mécanique de ce puissant système de gestion de bases de données open-source, vous aidant ainsi à en comprendre toutes les subtilités et donc à mieux l'administrer, le paramétrer, le superviser... en un mot à mieux l'utiliser.

    Sa lecture ne requiert pas de connaissances avancées de PostgreSQL, ni la maîtrise préalable d'un autre moteur de bases de données. En revanche, il est préférable que vous soyez à l'aise avec le fonctionnement d'un système d'exploitation comme Linux. Une connaissance modérée du langage SQL sera un plus.

    Cette troisième édition, entièrement relue et révisée, prend en compte les nouveautés de la version 13 (mise à jour 16/03/2021). Les différences notables entre versions sont signalées.
    Sommaire :
    Instance
    Fichiers
    Contenu physique des fichiers
    Architecture des processus
    Architecture mémoire
    Protocole de communication
    Gestion des connexions
    Gestion des transactions
    Gestion des objets
    Planification des requêtes
    Sauvegarde et restauration
    Réplication
    Statistiques d'activité
    Maintenance
    Sécurité

  • Cet ouvrage présente les principales caractéristiques de la conception puis de la réalisation d'une chaîne de mesures d'un procédé physique. La première partie décrit le traitement des signaux analogiques. La deuxième est consacrée au traitement des signaux numériques. Enfin, la troisième traite de l'acquisition de données et du choix et de la mise en oeuvre d'une chaîne de mesures. De nombreux exercices et problèmes résolus complètent chaque chapitre. Les exemples de l'ouvrage sont illustrés à l'aide du logiciel d'instrumentation industrielle LabVIEW.
    Cette cinquième édition met à jour en profondeur la troisième partie, et se voit agrémentée d'un chapitre sur la transmission des données numériques.
     


  • Les data sciences constituent une discipline fascinante, qui vous servira à transformer des données brutes en idées et connaissances
    aisément compréhensibles. L'objectif de ce livre est de vous aider à maîtriser les outils essentiels qui vous pe

  • Une bible magistrale sur SAS

    Ce livre présente le socle de connaissances communes à tous les utilisateurs de SAS, le progiciel d'informatique décisionnelle le plus utilisé au monde. Il traite tout particulièrement des fonctionnalités de Base SAS, module au coeur du système SAS. Pédagogique et complet, il peut servir aussi bien de guide d'initiation pour les utilisateurs débutants que d'ouvrage de référence pour les plus expérimentés, et concerne aussi bien les utilisateurs de SAS Foundation que ceux de SAS Enterprise Guide, SAS Studio et SAS University Edition.

    Cet ouvrage couvre les programmes des certifications SAS Certified Specialist: Base Programming Using SAS® 9.4 et Advanced Programming for SAS® 9.

    Parmi les sujets développés :


    la création, la manipulation et la gestion des tables de données ;

    les procédures d'exploration des données : construction de tableaux, de rapports, de graphiques au moyen des procédures ODS Graphics ;

    la production de documents au format HTML, PowerPoint, RTF, XLSX ou PDF avec ODS ;

    la procédure PROC SQL et le langage SQL de SAS ;

    le langage macro spécifique à SAS.


    Pour vous aider à bien assimiler tous les concepts, le livre comprend près de 500 programmes d'exemples, plus de 150 exercices et des liens vers une centaine d'articles en ligne.

    Une 4e édition mise à jour et augmentée

    Enrichie de plus d'une centaine de pages, cette nouvelle édition propose des mises à jour importantes sur :


    les passerelles entre SAS et Excel ;

    l'optimisation des ressources ;

    la production de graphiques au moyen de PROC SGPLOT et PROC SGPANEL ;

    la création et gestion de vos tables au moyen de PROC SQL.


    Le livre, qui porte essentiellement sur la version 9.4 de SAS, est également compatible avec les versions 9.2 et 9.3.

    Ce livre a le soutien de SAS France.

    À qui s'adresse cet ouvrage ?


    Aux professionnels souhaitant découvrir ou approfondir leurs connaissances de la programmation SAS

    Aux étudiants qui débutent avec SAS ou qui souhaitent préparer les examens de certification SAS Certified Specialist: Base Programming Using SAS® 9.4 et Advanced Programming for SAS® 9


  • Le manuel d'apprentissage de référence

    Cet ouvrage est un manuel d'apprentissage technique qui a été rédigé pour toute personne souhaitant développer des compétences sur une ou plusieurs technologie(s) de l'écosystème Hadoop. Il permet d'utili

  • Cet ouvrage traite de façon détaillée mais non technique les principes fondamentaux de la data science. Tout au long d'un processus de "raisonnement orienté données", il vous guidera pour acquérir des connaissances utiles et extraire une valeur économique des données que vous collectez. L'apprentissage de la data science vous permettra de comprendre les nombreuses techniques de data mining utilisées aujourd'hui. Ces principes sous-tendent tous les processus et stratégies de data mining qui servent à résoudre des problèmes d'entreprise.

    "Ce livre est bien plus qu'une introduction à l'analyse de données. C'est un guide essentiel pour ceux d'entre nous (nous tous ?) qui ont entièrement fondé leur entreprise sur l'ubiquité des données et la nécessité, aujourd'hui, de la prise de décision orientée données." Tom Phillips, PDG, Dstillery  ; ex-Directeur de Google Search and Analytics.

    "Les auteurs de ce livre, tous deux experts en data science avant même que la discipline soit nommée ainsi, présentent ici un sujet complexe en le rendant accessible à tous les niveaux. Cet ouvrage est une première du genre : il se concentre sur les concepts de la data science tels qu'ils doivent être appliqués aux problèmes concrets des entreprises. Il est rempli de captivants exemples réels qui illustrent les pro- blèmes courants auxquels les entreprises sont confrontées : l'attrition client, le marketing ciblé, et même une analyse des données sur les whiskies ! Ce livre se distingue par le fait qu'il n'est pas un traité d'algorithmique. Les auteurs ont pour objectif d'aider le lecteur à comprendre les concepts sous-jacents de la data science, mais également et surtout ils expliquent comment aborder un problème de data science et mettre au point une solution qui marche. Si vous avez besoin d'un aperçu complet de la data science, ou si vous êtes un data scientist en herbe qui veut maîtriser les bases de la discipline, ce livre est un indispensable pour vous." - Chris Volinsky, Directeur, Statistics Research,
    AT&T Labs, Gagnant du Netflix Challenge à 1 M$.

  • Ces dernières années, les besoins relatifs au traitement des données ont évolué à un rythme soutenu. Les sites web aux millions d'utilisateurs (réseaux sociaux, plates-formes de diffusion de contenus) sont à l'origine de l'essor de la plus dynamiq


  • Nous vivons une époque très excitante, qui ramène l'analyse de données et les méthodes quantitatives au coeur de la société. L'aboutissement de nombreux projets de recherche, la puissance de calcul informatique disponible et des données à profusio

  • Vous avez déjà une idée de ce qu'est Neo4j et de son mode de fonctionnement, peut-être même avez-vous déjà fait quelques tests. La question maintenant est de savoir comment le mettre en oeuvre dans un contexte de production. C'est ce que vous explique ce livre.
    Conçu sous la forme originale d'un dialogue entre les différents membres d'une équipe technique spécialisée dans la manipulation de données fortement connectées, il s'efforce de répondre à toutes les questions qu'on peut se poser lors de la mise en place d'un projet, de la preuve de concept jusqu'à la maintenance et la sécurisation. Des annexes, ainsi que de multiples encadrés au fil du récit viennent compléter certains aspects techniques.
    Vous y apprendrez :
    à analyser un problème en termes de graphe
    à intégrer Neo4j dans un système déjà existant et interagir avec d'autres bases de données
    à importer ou exporter des données
    à garantir la disponibilité et la sécurité des données
    à surveiller et maintenir Neo4j
    Si vous débutez avec Neo4j, nous vous recommandons de commencer par le volume I. Prise en main.
    "C'est sous forme théâtrale que j'ai choisi de relater le déploiement de Neo4j, car n'est-ce pas finalement ce à quoi ressemble notre vie professionnelle ? Un petit théâtre." - Sylvain Roussy
    "Le futur de Neo4j est plein d'innovation et de possibilités : Mervaillie, Roussy et Rouyer ont écrit un ouvrage abouti qui vous aidera à en tirer tout le potentiel." - Jim Webber, Chief Scientist de Neo4j, Inc.

  • Neo4j est un système de gestion de bases de données NoSQL orientées graphe, particulièrement adapté à des situations où les données sont fortement connectées et structurées selon des modèles complexes et évolutifs. À la différence des systèmes classiques, son approche n'est pas fondée sur l'algèbre relationnelle mais sur la théorie des graphes. Il permet ainsi de trouver de manière très performante des données reliées entre elles selon une profondeur non connue à l'avance. Ce livre vous permettra de prendre connaissance avec l'approche graphe de Neo4j et d'en mesurer le potentiel. Il vous fournira tous les outils pour pouvoir le tester aussi bien en local que sur un serveur distant. Vous apprendrez à l'aide d'exemples concrets à manipuler les données avec son langage d'interrogation CYPHER et via son API REST. Il s'adresse à tous les développeurs, responsables de projets, architectes logiciels en quête d'une alternative aux systèmes de bases de données relationnelles classiques. Il ne requiert aucune compétence particulière en matière de théorie des graphes. En revanche, une connaissance des bases de données traditionnelles aidera à mieux cerner les problématiques auxquelles répond Neo4j. Cette deuxième édition a été enrichie d'un nouveau chapitre portant sur les graphgists et l'analyse d'un cas d'utilisation. Son code a été entièrement révisé pour être compatible avec la version 3.0. et différents points ont été complétés pour intégrer les multiples changements apparus depuis la version 2.0 de Neo4j. Sommaire : Découvrir Neo4j Comprendre Neo4j Évaluer Neo4j : CYPHER Évaluer Neo4j : API REST Apprendre et partager avec les graphgists Annexes Aide-mémoire CYPHER Glossaire


  • This book provides you with a concrete approach of using Neo4j in a production context. Written in the style of a play, it reports the debates between the members of a technical team specialized in strongly connected data. It focuses on methodology, integrations with existing systems, performance, monitoring and security.

    You may already have an idea of what Neo4j is and how it works, and maybe you've even played around with some ideas using it. The question now is how you can take your graph project all the way to production-grade. This is what is discussed in this book.
    The book starts with a brief introduction to Neo4j and its query language, CYPHER, to help readers who are just beginning to explore Neo4j. Then we go straight to the subject in question: how to set up a real life project based on Neo4j, from the proof of concept to an operating production-grade graph database. We focus on methodology, integrations with existing systems, performance, monitoring and security.
    As leading experts in the Neo4j French community, the authors have chosen an unusual format to transmit their technical know-how: they tell you a story, a graph project story, where the protagonists are members of a technical team who specializes in the representation and manipulation of strongly connected data. The plot starts when a client come in with his project. You will attend their working sessions and see how they develop the project, fight over approaches, and ultimately solve the problems they encounter. Welcome to GraphITs.Tech!
    This audacious and, we hope, entertaining approach allows you to experience all aspects of setting up a graph database, from the various and sometimes opposing points of view of technical and network experts, project managers, and even trainees.
    Level: Intermediate/Advanced
    Table of contents:
    About Neo4j and CYPHER
    Welcome to GraphITs.Tech!
    1. A Little Bit of Method and Analysis
    2. Interact with Neo4j
    3. Data import/export
    4. Operating Neo4j
    5. Securing data
    Appendix Neo4j OGM and Spring Data Neo4j
    Appendix CYPHER Refcard

empty