Sécuriser une API avec HMAC

En plein développement du projet que je présenterai avec le Cii à l’ImagineCup, nous devons exposer une API à nos clients mobiles et desktop. En effet, à l’heure actuelle, un site internet ça ne suffit plus pour accompagner un client dans ses achats, et c’est ce que nous voulons faire. Certes, nous avons un site web, respectant les règles du Responsive Design, mais nous voulons utiliser au maximum les outils mis à disposition par Windows 8.1 pour accompagner la recherche pré-achat (contrats de partage, accès hors ligne, puissance de calcul déportée en local…) et les possibilités des smartphones actuels (localisation, notifications, hub social, capteur photo, accessibilité au touché…).

Nous exposons donc une API à notre public : nos partenaires comme les clients. Certaines données sont ouvertes car elles peuvent être obtenues de manière ouverte chez d’autres fournisseurs. Par contre il faut pouvoir authentifier nos clients…

L’authentification, c’est un peu plus complexe que prévu quand on parle d’API. Utiliser un jeton de session, c’est s’assurer ce qu’on appelle une « side attack », autrement dit, quelqu’un qui sniff le réseau en attente du cookie de session, le prend et se fait passer pour nous avec ce cookie. Comme il nous est impossible d’utiliser de jeton CSRF avec une API, ça complique tout.

Deux grandes solutions s’offrent à nous :

  • Implémenter OAuth 2.0
  • Utiliser une authentification par HMAC

OAuth2.0 c’est bien, mais ça a un coût : il faut un fournisseur d’identité complet et surtout c’est plus lent. Notre choix est donc d’utiliser HMAC.

Le fonctionnement

 

Le but est ici de transmettre au serveur de manière totalement chiffré un couple clef publique/clef privée. Le chiffrement se fait par la méthode HMAC.

Figure 1Formulation de HMAC

h est ici la fonction de hashage (SHA-1, SHA-256…), K est la clé privée, m est dans notre cas la clef publique ainsi que d’autres informations utiles pour sécuriser l’envoie. Opad et ipad sont des constantes internes à la fonction HMAC.

La clef privée est une chaîne de caractère aléatoire qui est connue du client et du serveur seuls. Cette clef ne doit pas être envoyée sur le réseau sauf à envisager un échange plus complexe de type zero knowledge.

La clef publique est une clef qui est utilisée pour déterminer la personne qui demande l’authentification. Elle ne permet pas de l’authentifier en soit.

  1. Côté client : On calcule le Hashmac(clef privée, clef publique). HASHMACSHA256 ou HASHMACSHA512 sont conseillés.
  2. Côté client : On insère la clef publique et le hashmac dans l’url sous forme de paramètre GET ou bien on glisse ça dans une entête http étendue.
  3. Côté client : On insère les données demandées par le programme.
  4. Côté serveur : On récupère la clef publique et on regarde si elle correspond à un utilisateur et que cet utilisateur a le droit d’accéder aux données. Sinon 401 :UnAuthorized
  5. Côté serveur : On calcule le Hashmac(clef privée, clef publique) avec le même algorithme que le client. On compare le hashmac fournie par le client et celle calculée. Si elles ne sont pas identiques => 401 Unauthorized
  6. Côté serveur : On exécute la requête envoyée et on renvoie les données, si possible de manière cryptées.

Le problème réside donc dans la clef privée : comment la rendre privée ?

Dans le cas de Amazon, c’est assez simple, quand on inscrit un compte développeur, ils nous donne cette clef et nous disent de ne pas la compromettre. Mais dans le cas d’une application mobile ?

On ne peut pas demander à nos utilisateur d’entrer une suite indescriptible de chiffres et de lettres par pure plaisir, non ?

Et puis comment on gère le fait qu’il y a une clef privée par personne ? Impossible.

Un moyen est simplement de compiler la clef privée avec l’application et de la changer régulièrement, à chaque mise à jour de l’application par exemple. C’est relativement sécurisé mais ça n’empêchera pas les utilisateurs dont le téléphone est rooté de tenter de décompiler le programme et d’en extraire la clef privée et la manière dont vous hashez le tout.

A partir d’un moment il semble donc que OAuth soit nécessaire mais pour la plupart des utilisations, HMAC semble être un très bon compromis entre facilité de développement, sécurité, et rapidité d’exécution.

 

Les failles qu’il faut combler

 

Les attaque par « replay »

 

Ces attaques se servent d’une fonctionnalité qui est souvent souhaitable pour les API destinées à la mobilité : la possibilité de retenter la requête plusieurs fois.

L’attaquant observe le réseau et prend votre signature ainsi que la clef publique puis lance une flopée de requêtes qui ne sont pas celles que vous désiriez lancer. Quand l’utilisateur a un accès restreint, ça va, mais quand c’est un utilisateur à haut niveau de privilège, je vous laisse imaginer le désastre.

La première idée sera donc marquer temporellement la clef publique pour que sa validité ne soit bonne que durant un temps donné, une, deux, dix minutes par exemple.

Les attaques par replay sont toujours possibles, mais elles offrent moins de temps.

Une seconde idée est de fournir dans la clef publique un jeton unique qui identifiera la requête. Cet identifiant est simplement un compteur de requêtes.

Lorsque vous envoyez votre requête, vous incluez le jeton dans la clef publique et l’incrémentez aussi bien côté client que côté serveur. Lorsque l’attaquant voudra récupérer la hashmac de la première requête celle-ci ne sera plus valide. En effet si le serveur a renvoyé une réponse à cette requête alors il s’attend au jeton suivant et non plus à celui qui a permis de générer la signature usurpée.

Les attaques par changement de méthode.

 

Dans le cas d’un homme dans le milieu, ce dernier tentera d’utiliser l’authentification de l’utilisateur pour envoyer un POST/DELETE/PUT alors que la requête de départ est un GET par exemple. Cela peut générer des gros problèmes, surtout quand, par exemple, le routeur de ASP.NET MVC se base sur les méthodes pour désigner quelle action exécutée.

La parade est ici très simple : on inclut la méthode dans la signature. Ainsi si l’attaquant usurpe votre signature, il ne peut pas usurper votre demande.

L’URI de base doit être, dans ce modèle elle aussi ajoutée à la signature.

 

Et bien d’autres encore… Il est aussi toujours nécessaire d’utiliser une connexion HTTPS pour transmettre les données de manière cryptée !

sécuriser les mots de passe

Hier, les développeurs de PHP ont entériné par un vote unanime (chose rare !) la création d’une API simplifiée de hashage de mot de passe. C’est une occasion en or pour rappeler quelques bons principes en ce qui concerne la sécurité des données de vos utilisateurs

Etre sécurisé, techniquement

Lorsque l’on développe un système qui nécessite l’authentification d’un utilisateur pour que celui-ci puisse consulter des données qui lui sont réservées, vient toujours à un moment la considération “que fais-je du mot de passe”?

Le choix du clair

Certains sites comme skyrock (hébergeur des skyblog) ont décidé… d’enregistrer en clair les mots de passe dans leur bdd et de séuriser “un maximum” leur bdd en amont. L’intérêt qu’ils y voient c’est la facilité de retrouver une mot de passe que l’utilisateur aurait perdu.

Oui, mais… ce n’est pas du tout sécurisé. Si le mot de passe est stocké en clair, ça signifie que quiconque (employé, pirate suffisamment bon pour obtenir un bout de la bdd…) peut obtenir sans effort le mot de passe de l’utilisateur et aller fouiller dans ses données personnelles. Les gens de skyrock relativisent en disant que de toute façon, les données enregistrées dans leur bdd sont toutes, ou presque, publique, donc pas d’inquiétude.
Plusieurs problèmes se posent :
Premièrement, j’y reviendrait dans la seconde partie de mon billet, un mot de passe n’ouvre pas que l’accès à  skyrock pour un pourcentage d’utilisateur fort élevé vu l’audience visée par le site.
Secondement, skyrock vous dit “votre mot de passe est sécurisé car c’est nous qui le gardons secret et ne le communiquons qu’avec vous”. Oui mais c’est ce qu’on appelle une pétition de principe : le mot de passe est sécurisé parce que nous gardons le secret… donc nous partons du principe que le secret est gardé. Or je le rappelle les attaques contre lesquelles nous voulons nous prémunir sont un pirate qui force la bdd ou un employé qui recopie la bdd pour  son usage personnel, en gros une violation du secret…

RSA : chapeau

Viennent ensuite les gens qui veulent crypter, ou chiffrer comme on dit en France. RSA ne signifiant plus ici une allocation mais un algorithme asymétrique de cryptage des données. Asymétrique parce qu’il utilise une clef privée (encore un secret à  garder) pour décrypter les messages.

Mais que signifie “crypter”? Ca signifie que toute donnée est transformée de manière unique en une autre donnée afin de rendre “incompréhensible” le message pour quoi n’a pas le code pour la transformation inverse.

Car transformation inverse il y a. Donc pour peu que le secret ait été éventé (bien qu’il soit plus facile de cacher un fichier de clef qu’une bdd), le code reste donc traductible, c’est comme si on avait le mot de passe en clair.
Sauf qu’on fait consommer du temps de calcul à  l’ordinateur. Ca tombe bien, c’est ce qu’on désire faire en fait : forcer le pirate à  prendre tellement de temps que ça n’est pas rentable pour lui d’aller essayer de récupérer notre mot de passe.
Alors, certes, les algo de cryptage prennent des ressources, mais, malheureusement, ils ne nécessitent qu’un essai pour être craqué une fois que le secret a été éventé. La bruteforce n’est pas utile et donc finalement, prendre 500ms au lieu de 5, le pirate s’en fiche.

Du sel? Du poivre? dans vos épinard hashés

La “solution” est donc le hashage, ou signature en français.
Le hashage fonctionne de cette manière :
il prend votre chaîne et la transforme en une chaîne de longueur donnée, 32 caractères pour md5 par exemple.

Il faudra se souvenir que ces caractères sont des lettres minuscules ou des chiffres.

A partir de ces deux précisions, vous constaterez que deux mots de passe différents peuvent avoir la même signature, c’est ce qu’on appelle une collision.
Heureusement, face au panel de mots de passe réellement utilisés par les gens, les collisions sont très rares, néanmoins à  cause de ses 32 caractères, des dictionnaires ont déjà  été créés pour md5 afin de créer des collisions.

Une solution envisageable est de mettre un grain de sel (ou un grain de poivre) dans votre mot de passe : c’est à  dire qu’avant hashage, vous faites muter votre mot de passe en y ajoutant une certaine chaîne. La nuance entre sel et poivre n’est ici pas le goût mais le fait que le sel est public (souvent stocké en bdd) alors que le poivre est gardé secret (toujours la même chose, il est secret tant que le secret n’est pas éventé). Cela permet de ralentir la création de tables.

On peut alors penser à  utiliser des algorithmes comme sha1, sha512, samba2, tiger…
Le problème de ces algorithme est qu’ils sont “sensibles” à  l’attaque par force brute. sha1 a déjà  été largement déconseillé à  cause de ça, sa rapidité d’exécution fait qu’il est facile à “bruteforcer”. Les autres sont pour l’instant relativement coûteux et donc peuvent être utilisés, mais ils vont devenir obsolète un jour ou l’autre à cause de la loi de Moore :

Le nombre de transistors des microprocesseurs sur une puce de silicium double tous les deux ans

Cela signifie que les algorithmes dont je vous parle, s’ils sont impossibles à  mettre dans des dictionnaires ou tables en arc-en-ciel finiront par être déverrouillés très rapidement par la monté en puissance des ordinateurs.

Alors que faire?
Il existe un algorithme, souvent appelé blowfish qui est tout à  fait particulier. Ce dernier ne prend pas simplement un mot de passe et un grain de sel comme paramètre, mais aussi une “complexité”. Cette complexité définit en fait la quantité de temps que devra mettre l’algorithme pour donner son résultat. Plus le temps est élevé, plus l’algorithme est coûteux. Mon expérience me dit que la complexité est souvent donnée par le chiffre 12, sinon la génération du hashcode peut devenir trop coûteuse, mais bon chacun voit midi à  sa porte et je n’ai pas envie de créer de débat là  dessus.

En php on utilise la fonction crypt pour appeler blowfish.
Elle s’utilise en donnant comme paramètre de sel une chaîne de caractère formée ainsi :

  • [ul]$2a$ ou $2x$ ou $2y$ depuis 5.3.7
  • deux chiffres pour la complexité, donc 07 pour 7
  •  un $
  • 22 caractères alphanumériques puis un $

Par exemple, dans la donc on nous propose

[cci lang=”php”]echo crypt(‘rasmuslerdorf’, ‘$2a$07$usesomesillystringforsalt$’) ;[/cci]

En Python on trouve :
[cc lang=”python”]import bcrypt
#la complexité est ici de 10, par défaut c’est 12
hashed = bcrypt.hashpw(password, bcrypt.gensalt(10))[/cc]

Etre sécurisé : socialement

La plus grande faille de sécurité, ce sont vos utilisateurs. Ils utilisent souvent le même mot de passe pour plusieurs voire tous les sites sur lesquels ils sont inscrits. Donc trouver un mot de passe dans votre bdd, aussi peu importante soit-elle, ça peut signifier le piratage de comptes plus importants pour ces utilisateurs.

Vient ensuite un autre problème : la mémoire des utilisateurs. Un mot de passe complexe, tel @fçz59fo est complexe à  retenir, sans pour autant être complexe à  trouver pour un ordinateur qui essaierait un peu de bruteforce. En effet trouver une chaîne de 9 caractères c’est relativement facile pour un ordinateur, et puisque ce dernier n’aura pas l’idée d’aller essayer le nom du chien, le surnom de la première voiture de l’utilisateur que l’on veut pirater comme le font les espions américains dans nos séries préférées, la “difficulté” du mot de passe est un peu surfaite.
Un 9gag est devenu assez célèbre à  ce propos, qui disait “Durant ces 10 dernières années nous avons formé les gens à  faire des mots de passe impossibles à  retenir pour l’homme mais facilement devinables pour un ordinateur”. Quel dommage.

TL;DR

 

 

blowfish sur un mot de passe suffisamment long, mais pas forcément avec des caractères spéciaux, tu utiliseras, et tes données sécurisées seront