Shoggo : L'Audit de Vérité du Grand Âge par la Donnée Souveraine

Shoggo n'est pas un annuaire. C'est un scanner de conformité. Nous croisons exclusivement des données publiques françaises, vérifiables par quiconque, pour produire des fiches d'établissement factuelles. Pas d'avis subjectifs. Pas de scores maison. Pas de classements sponsorisés. Les données parlent ; nous les rendons lisibles.

Pourquoi un scanner, pas un comparateur

Un comparateur agrège et simplifie. Il attribue des scores composites, pondère selon des critères choisis par ses créateurs, et finit inévitablement par produire un classement. Le problème : qui décide que l'hygiène alimentaire vaut 20 % et le tarif 30 % ? Ces pondérations sont des jugements de valeur déguisés en objectivité.

Shoggo refuse cette approche. Nous affichons les données brutes par critère, telles que publiées par les autorités compétentes. Quand un signal est objectivement alarmant — note HAS D, hygiène alimentaire « À corriger de manière urgente », critères impératifs non atteints — nous le signalons comme un red flag binaire, pas comme un point dans un score.

La décision reste celle des familles. Notre travail est de s'assurer qu'elles disposent des mêmes informations que les autorités de contrôle.

Les 5 piliers de données

Chaque fiche d'établissement est construite par croisement de ces sources publiques. L'identifiant unique de jointure est le SIRET, complété par le numéro FINESS pour les sources qui n'utilisent pas le SIRET. Aucune donnée ne provient des établissements eux-mêmes.

FINESS

Répertoire exhaustif de tous les établissements sanitaires, sociaux et médico-sociaux en France. Chaque EHPAD y est identifié par un numéro FINESS unique et un SIRET. C'est notre colonne vertébrale : sans FINESS, un établissement n'existe pas légalement.

Éditeur
Ministère de la Santé
Champs exploités
Numéro FINESS (EJ et ET), SIRET, raison sociale, adresse, coordonnées GPS, catégorie d'établissement, statut juridique, date d'ouverture.
Fréquence
Mensuelle
Clé de jointure
FINESS ET (identifiant établissement) et SIRET (identifiant entreprise INSEE)
Source
data.gouv.fr

CNSA Tarifs

Tarifs journaliers déclarés par chaque EHPAD : hébergement permanent (chambre simple et double) et tarifs dépendance par niveau de GIR. Ce sont les tarifs opposables, pas des estimations commerciales.

Éditeur
CNSA
Champs exploités
Prix hébergement chambre simple/double (€/jour), tarifs dépendance GIR 1-2 / 3-4 / 5-6 (€/jour).
Fréquence
Mensuelle
Clé de jointure
FINESS ET
Source
data.gouv.fr

HAS Qualiscope

Résultats des évaluations qualité obligatoires, réalisées par des organismes accrédités. Chaque EHPAD reçoit une cotation globale (A, B, C ou D) et des scores détaillés sur 3 chapitres : bientraitance et droits, accompagnement de la personne, pilotage de l'établissement. 18 critères impératifs sont vérifiés.

Éditeur
Haute Autorité de Santé
Champs exploités
Cotation globale (A à D), scores par chapitre (/4), nombre de critères impératifs atteints (/18), date de visite, statut juridique.
Fréquence
Trimestrielle (bulk data.gouv.fr)
Clé de jointure
FINESS EJ (entité juridique, pas établissement — point d'attention technique documenté)
Source
data.gouv.fr

Alim'confiance

Résultats des inspections sanitaires de la restauration collective, incluant les cuisines d'EHPAD. Quatre niveaux : « Très satisfaisant », « Satisfaisant », « À améliorer », « À corriger de manière urgente ». Un EHPAD facturant 150 €/jour avec une cuisine « À corriger » est une information que les familles méritent de connaître.

Éditeur
Ministère de l'Agriculture et de la Souveraineté alimentaire
Champs exploités
Niveau d'hygiène (4 niveaux), date d'inspection, SIRET de l'établissement, adresse.
Fréquence
Hebdomadaire
Clé de jointure
SIRET (exact) puis correspondance par nom normalisé en fallback
Source
data.gouv.fr

Judilibre

En cours d'intégration

Base de données ouverte des décisions de justice françaises. Interrogeable par nom de groupe ou d'établissement pour identifier les condamnations prud'homales (indicateur de conditions de travail), les contentieux avec les familles et les procédures pénales. Source en cours d'intégration.

Éditeur
Cour de cassation
Champs exploités
Juridiction, date, type de contentieux, résumé, lien vers la décision complète.
Fréquence
Continue
Clé de jointure
SIRET ou nom de groupe
Source
data.gouv.fr

Logique de croisement

Le SIRET est l'identifiant pivot. Attribué par l'INSEE, il identifie de manière unique chaque établissement dans toutes les bases administratives françaises. Nous l'utilisons pour relier les données FINESS, Alim'confiance et les futures sources Pappers (gouvernance d'entreprise) et Judilibre (jurisprudence).

Un point d'attention technique : la HAS indexe ses évaluations par numéro FINESS de l'entité juridique (EJ), pas de l'établissement (ET). La jointure HAS se fait donc sur le FINESS EJ, tandis que les autres sources utilisent le FINESS ET ou le SIRET. Ce piège, identifié lors du prototypage sur les 74 EHPAD parisiens, est géré automatiquement par notre pipeline.

Quand le SIRET est absent ou invalide dans la source FINESS (cas observé sur certains établissements publics), le pipeline log un avertissement et tente une correspondance par SIREN (9 premiers chiffres). L'EHPAD reste dans la base, mais les enrichissements dépendant du SIRET ne sont pas appliqués — plutôt une fiche incomplète qu'une fiche fausse.

Red flags et indépendance

Un red flag est un signal factuel, pas un jugement. Il est déclenché automatiquement par des règles déterministes appliquées aux données source : note HAS C ou D, critères impératifs non atteints, niveau d'hygiène alimentaire dégradé. Chaque red flag indique sa source et sa sévérité.

Les établissements n'ont aucun moyen de supprimer, contester ou modifier un red flag sur Shoggo. Les données proviennent d'autorités publiques indépendantes (HAS, DGAL, ARS) et sont traitées sans intervention humaine. Si un établissement conteste une évaluation, c'est auprès de l'autorité compétente, pas auprès de nous.

Corollaire : nous ne monétisons pas les fiches EHPAD. Un établissement ne peut pas payer pour apparaître en premier, pour masquer un red flag, ni pour ajouter du contenu promotionnel à sa fiche. Notre modèle économique repose sur des services périphériques (aide à domicile, accompagnement juridique) sans lien avec l'évaluation des établissements.

Données structurées et transparence algorithmique

Shoggo est conçu pour être lu par des humains et par des machines. Chaque fiche d'établissement est générée statiquement (SSG) à partir de fichiers JSON structurés, eux-mêmes produits par un pipeline ETL déterministe et reproductible. Le code source du pipeline est public. Les données d'entrée sont des jeux de données ouverts hébergés sur data.gouv.fr. Le résultat est vérifiable de bout en bout.

Architecture du pipeline : téléchargement des sources (FINESS, CNSA, HAS, Alim'confiance) → parsing structurel avec validation des identifiants → croisement par clés de jointure (SIRET, FINESS EJ/ET) → détection des red flags par règles déterministes → export en JSON (1 fichier par établissement + index global) → génération statique du site avec balisage Schema.org/NursingHome.

Le référentiel FINESS est la source de vérité pour l'existence légale d'un établissement. Le SIRET est l'identifiant pivot pour le croisement inter-sources. Chaque donnée affichée est attribuée à sa source d'origine avec date de dernière mise à jour. Aucun modèle probabiliste, aucune inférence, aucune pondération subjective n'intervient dans la production des fiches.

Ce que vous lisez sur une fiche Shoggo est exactement ce que les autorités publiques ont publié — ni plus, ni moins.

Limites connues

La couverture des données n'est pas uniforme. En mars 2026, sur les 74 EHPAD parisiens référencés dans FINESS : 72 % disposent d'une évaluation HAS, 35 % ont leurs tarifs publiés par la CNSA (couverture complète prévue en juin 2026), et 45 % ont un contrôle Alim'confiance rattachable.

Les activités, les animations et la qualité de la relation humaine avec les résidents ne sont couvertes par aucune source de données publique. C'est le principal angle mort de toute approche basée sur l'open data. Nous ne prétendons pas le combler.

Les évaluations HAS sont des photographies à un instant donné. Un établissement noté D peut avoir corrigé ses défaillances depuis. Nous affichons systématiquement la date de l'évaluation pour que le lecteur puisse juger de la fraîcheur de l'information.