Introduction
Enterprise
Les enrichissements Enterprise sont des métadonnées supplémentaires incluses dans le corps de la réponse de certaines API de données. Ils sont disponibles uniquement avec des formules d’abonnement payantes.
Le tableau ci-dessous propose une brève description de chaque enrichissement :
| Enrichment: | Description: |
|---|---|
| Expanded and Enhanced URLs | Développe automatiquement les URL raccourcies (par exemple bitly) présentes dans le corps d’une Publication et fournit les métadonnées HTML Title et Description de la page de destination. |
| Matching rules object | Indique quelle règle ou quelles règles ont été appliquées aux Publications reçues. L’objet renvoie le tag de règle et l’id de la règle dans l’objet de réponse. |
| Poll metadata | Indique la présence d’un sondage dans une Publication, inclut la liste des choix du sondage et précise à la fois la durée du sondage et l’heure d’expiration. |
| Profile geo | Données de localisation dérivées du profil utilisateur, y compris les coordonnées [longitude, latitude] (lorsque cela est possible) et les métadonnées de lieu associées. |
URLs développées et enrichies
title et de la description de la page de destination.
Détails importants :
- Pour résoudre un lien raccourci, notre système envoie des requêtes HTTP HEAD vers l’URL fournie et suit toutes les redirections jusqu’à atteindre l’URL finale. Cette URL finale (ET NON le contenu de la page elle‑même) est ensuite incluse dans le payload de la réponse.
- L’enrichissement d’URL ajoute une latence de 5 à 10 secondes aux flux en temps réel.
- Pour les requêtes adressées à la Full Archive Search API, les données d’enrichissement Expanded and Enhanced URL ne sont disponibles que pour les Publications âgées de 13 mois ou moins.
- L’enrichissement d’URL n’est pas disponible pour les liens de Publication (y compris les Tweets cités), les liens Moments et les liens de profil qui sont inclus dans une Publication.
Charge utile de la Publication
entities de la charge utile de la Publication – plus précisément dans l’objet entitites.urls.unwound. Il fournit les champs de métadonnées suivants :
- URL développée -
unwound.url - Statut HTTP développé -
unwound.status - Titre HTML de l’URL développée - limite de 300 caractères -
unwound.title - Description HTML de l’URL développée - limite de 1000 caractères -
unwound.description
entities contenant un lien vers une Publication qui n’est pas enrichi :
**
Opérateurs de filtrage
- Exemple : “url:tennis”
- Correspondance tokenisée sur toute URL étendue qui contient le mot tennis
- Peut aussi être utilisé comme filtre pour inclure ou exclure des liens provenant d’un site web spécifique, en utilisant par exemple “url:npr.org”
- Exemple : “url_title:tennis”
- Correspondance tokenisée sur toute balise de titre HTML d’une URL étendue qui contient le mot tennis
- Correspond aux données de titre HTML incluses dans la charge utile, qui est limitée à 300 caractères.
- Exemple : “url_description:tennis”
- Correspondance tokenisée sur toute balise de description HTML d’une URL étendue qui contient le mot tennis
- Correspond à la description HTML incluse dans la charge utile, qui est limitée à 1000 caractères.
Codes de statut HTTP
- Atteignions un code de la série 200 (succès)
- Atteignions un code d’une série qui ne correspond pas à une redirection (échec)
- Arrivions à un dépassement de délai parce que l’URL finale n’a pas pu être résolue dans un délai raisonnable (renvoie un 408 - délai dépassé)
- Rencontrions une exception quelconque
| Raison | Code de statut renvoyé |
|---|---|
| Exceptions SSL | 403 (Forbidden) |
| Développement non autorisé par l’URL | 405 |
| Socket Timeout | 408 (Timeout) |
| Unknown Host Exception | 404 (Not Found) |
| Unsupported Operation | 404 (Not Found) |
| Connect Exception | 404 (Not Found) |
| Illegal Argument | 400 (Bad Request) |
| Tout le reste | 400 (Bad Request) |
Règles de correspondance
matching_rules reflète toutes les règles qui se sont appliquées au résultat donné. En d’autres termes, si plusieurs règles correspondent à une même Publication, celle-ci ne sera renvoyée qu’une seule fois, mais l’élément matching_rules contiendra l’ensemble des règles correspondantes.
Métadonnées de sondage
Détails importants :
- Disponible dans toutes les API Enterprise (PowerTrack, Replay, Search, Historical PowerTrack)
- Remarque : pour Replay et Historical PowerTrack, ces métadonnées ont été rendues disponibles pour la première fois le 22/02/17.
- N’inclut pas d’informations de vote ni de résultats de sondage
- Ne prend actuellement pas en charge les filtres/opérateurs
- Disponible uniquement en format natif enrichi
- Le format natif enrichi est un paramètre contrôlé par l’utilisateur qui peut être modifié à tout moment via la console : Select a Product (PowerTrack, Replay, Search) > Settings tab > Output Format (Leave data in its original format)
Charge utile de la Publication
- Un tableau “options” avec jusqu’à quatre options comprenant la position (1-4) et le texte de l’option
- Date d’expiration du sondage
- Durée du sondage
Exemple de charge utile
Localisation du profil
Introduction
Remarque : Une partie des géodonnées utilisées pour créer l’enrichissement Profile Geo provient de GeoNames.org et est utilisée par X en vertu de la licence Creative Commons Attribution 3.0.
Données Profile Geo
| Nom du champ natif enrichi | Valeur d’exemple | Description |
|---|---|---|
| user.derived.locations.country | United States | Le pays d’origine de l’utilisateur qui a créé la Publication. |
| user.derived.locations.country_code | US | Un code de pays ISO-3166 à deux lettres correspondant au pays d’origine de l’utilisateur qui a créé la Publication. |
| user.derived.locations.locality | Birmingham | La localité (généralement la ville) d’origine de l’utilisateur qui a créé la Publication. |
| user.derived.locations.region | Alabama | La région (généralement l’État ou la province) d’origine de l’utilisateur qui a créé la Publication. |
| user.derived.locations.sub_region | Jefferson County | La sous-région (généralement le comté) d’origine de l’utilisateur qui a créé la Publication. |
| user.derived.locations.full_name | Birmingham, Alabama, United States | Le nom complet (hors sous-région) du lieu d’origine de l’utilisateur qui a créé la Publication. |
| User.derived.locations.geo | See Below | Un tableau qui inclut une valeur de latitude/longitude pour une coordonnée correspondant au lieu au plus faible niveau de granularité d’où est originaire l’utilisateur qui a créé la Publication. |
Exemple de payload
Limitations
- L’enrichissement Profile Geo tente de déterminer le meilleur choix pour le lieu géographique décrit dans la chaîne de localisation du profil. Le résultat peut ne pas être exact dans tous les cas, en raison de facteurs tels que l’existence de plusieurs lieux aux noms similaires ou de noms ambigus.
- Si aucune valeur n’est fournie dans le champ de localisation du profil d’un utilisateur (actor.location), nous ne tenterons pas d’effectuer de classification.
- Niveau de précision : si un enrichissement Profile Geo ne peut être déterminé avec un niveau de confiance suffisant qu’au niveau du pays ou de la région, les géographies de niveau inférieur, comme subRegion et locality, seront omises de la charge utile.
- L’enrichissement Profile Geo fournit des coordonnées lat/long (un point unique) qui correspondent au niveau de précision des résultats de l’enrichissement. Ces coordonnées représentent le centre géographique des résultats de localisation de l’enrichissement. Par exemple, si le niveau de précision est au niveau du pays, ces coordonnées sont alors définies sur le centre géographique de ce pays.
- Les opérateurs PowerTrack fournis pour les propriétés d’adresse (locality/region/country/country code) sont volontairement granulaires afin de permettre de nombreuses combinaisons de règles. Lorsque vous tentez de cibler un lieu spécifique qui partage son nom avec un autre lieu, envisagez de combiner des règles d’adresse. Par exemple, l’exemple suivant évitera les correspondances pour « San Francisco, Philippines » : profile_locality:“San Francisco” profile_region:California. Lorsque vous créez des règles qui ciblent des champs Profile Geo individuels, gardez à l’esprit que chaque niveau de granularité supplémentaire limitera les résultats que vous voyez. Dans certains cas, lorsque vous tentez d’examiner des données provenant d’une ville, vous pouvez choisir de ne vous appuyer que sur une règle de région lorsque cette région recoupe largement la ville ; par exemple, la ville de Zurich, en Suisse, peut être efficacement ciblée, ainsi que les zones environnantes, avec profile_region:“Zurich”.
- Utilisation avec les Publications à géolocalisation native : l’enrichissement Profile Geo fournit un type de géographie alternatif pour une Publication, différent de la valeur geo native dans la charge utile. Ces deux types de géographie peuvent être combinés pour capturer l’ensemble des Publications possibles liées à une zone donnée (sur la base des géodonnées disponibles), même s’ils ne sont pas conceptuellement équivalents.