Prise en main d'un entrepôt de données sous Talend
- Détails
- 87511
Talend est une suite logicielle ETL, dont l'une des briques existe sous licence libre et gratuite : Talend Open Studio for Data Integration (TOS), dédiée à l'intégration et à la manipulation de sources de données hétérogènes.
Téléchargez l'outil depuis la page officielle et installez-le sur votre machine. Il s'agit de dézipper le fichier fourni et de le placer près de vos programmes. Il contient deux exécutables (.exe), selon la binarité de votre machine, dont vous pouvez créer un raccourci.
N'hésitez pas à tester les deux exécutables en 32 ou 64 bits si besoin (incohérences constatées sur certaines machines sous Windows, mais sans problème fonctionnel).
Pour fonctionner, Talend a besoin d'une version récente de Java.
Ce tutoriel d'initiation suppose que soyez déjà familier avec les SGBD MySQL et/ou Postgres, et que vous en disposiez.
Les images de cet article sont cliquables et affichent des informations contextuelles supplémentaires.
À la découverte de Django et GeoDjango
- Détails
- 61632
Dans l'éternelle quête d'un système simple et performant pour mettre en place un système d'édition de données spatiales via un navigateur web, de façon sécurisée et sur une base Postgres, il faut nous confronter au framework Django.
Cet article est une vulgarisation/fusion des deux tutoriels officels Django et GeoDjango. Ces derniers sont bien plus détaillés et vous les trouverez ici :
- Tutoriel officiel Django : https://docs.djangoproject.com/fr/1.9/intro/tutorial01/
- Tutoriel officiel GeoDjango : https://docs.djangoproject.com/fr/1.9/ref/contrib/gis/tutorial/
Le tuto officiel Django se base sur les toutes dernières versions des outils, et sur Linux. En fonction de sa machine locale ou des serveurs web à notre disposition, il peut y avoir des différences. La syntaxe de certaines lignes de commande Django ou Python peuvent changer, ainsi que la façon d'appeler vos apps ou vos importations.
D'autre part faire ses 1ers pas dans GeoDjango nécessite de s'être d'abord familiarisé à Django. On n'utilise pas ce module additionnel sans le framework complet.
Je vais donc tenter de clarifier tout cela, ne serait-ce qu'à mes yeux, et en allant rapidement vers les fontionnalités les plus basiques de GeoDjango. Au terme de cet article, nous aurons un système de CRUD sur de la donnée spatiale, en points, lignes et polygones, avec un fond OpenStreetMap, le tout accessible sur authentification.
Manage a smart thesaurus from free keywords
- Détails
- 3711
Recently I wanted to add a dynamic thesaurus in a medical videos information system. Videos are hosted at Vimeo, sometimes with access rights. End user must go through the system to view all the videos.
We would that end users to be able to navigate from one video to another according to suggestions from common keywords, visibles or not. In order to increase the average session duration on the website.
Administrators are medical professionals, they add scientific content with references potentially very detailed, and impossible to guess exhaustively.
So to organize the videos it was necessary to allow administrators to enter free keywords, like tags, in a simple text field. Nothing incredible so far example:
This is already enough to enrich user searches. But how to link the videos between them? Gracefully if possible.
Keywords should feed a formatted thesaurus, which can be used with SQL. Otherwise you will face to limitations of using, or need to multiply queries just to display few links.
Recover names from anonymous email addresses avoiding errors
- Détails
- 3088
Many tools can retrieve names from anonymous emails. But to get something clean, avoid errors and keep a custom default value for generic emails, better to do it yourself.
First, description of the problem.
Tag name
Here we concatenate salutation, first and last names from a table called users
, in a tag called name
. This in order to personalize newsletters, example:
Salutation | First name | Last name | HTML | View in mailbox and browser |
Mr | Edward | Osborne Wilson |
<span>Dear [name]</span> |
Dear Mr Edward Osborne Wilson |
OK good. But sometimes we have not all salutation, first and last names. And may we get a strange value even with all 3 fields concatenated:
Recover names from anonymous email addresses avoiding errors
À la découverte de FME
- Détails
- 15685
FME (Feature Manipulation Engine) est un logiciel ETL distribué par la société Safe Software. Il est pourvu de nombreuses composantes spatiales (on dit parfois ETL spatial) et est déjà bien répandu dans le monde de la géomatique.
FME est sous licence propriétaire, mais il est possible d'obtenir une licence d'évaluation sur leur site officiel.
Nous allons ici prendre en main les fonctionnalités les plus basiques du logiciel.
Les images de cet article sont cliquables (affichage plein écran) et proposent parfois des informations contextuelles supplémentaires.
Si vous n'êtes pas encore familiarisé avec les ETL, vous pouvez consuter cet autre article, dont l'introduction évoque les ETL et entrepôts de données en général.
Une solution pour créer des applications de bases de données: Fabrik
- Détails
- 16471
De nombreux utilisateurs de bases de données (BDD) ont parfois besoin de mettre à disposition d'autres utilisateurs des applications BDD, pour la saisie ou la consultation, avec des problématiques de délais, de coûts ou de transmission. Le composant Fabrik, sous le CMS Joomla, permet un usage fin des bases de données, avec une efficacité de déploiement et une grande ergonomie pour les utilisateurs.
Fabrik est un CCK (Construct Content Kit, ou quelque chose comme ça...). Joomla dispose de plusieurs CCK, chacun ayant ses qualités et ses défauts. Certains disent que Fabrik n'est pas celui bénéficiant de la meilleur intégration sur Joomla, lui préférant Seblod par exemple (hum... à discuter). Mais c'est peut-être le plus orienté base de données relationnelles, si vous souhaitez mettre en place un système BDD tel que vous l'avez imaginé, et non pas tel que l'outil l'exige.
Cette souplesse permet d'y voir clair dans votre système, et de concevoir rapidement des outils extensibles, déportables et industrialisables.
Un article plus détaillé est disponible sur ce site.
Une solution pour créer des applications de bases de données: Fabrik
Page 5 sur 6