Introduction
Enterprise
Les enrichissements Enterprise sont des métadonnées additionnelles incluses dans la charge utile de réponse de certaines API de données. Ils sont disponibles uniquement dans les offres d’abonnement payantes.
Le tableau ci-dessous propose une brève description de chaque enrichissement :
Enrichment: | Description: |
---|---|
Expanded and Enhanced URLs | Développe automatiquement les URL raccourcies (p. ex. : bitly) incluses dans le corps d’un Post et fournit les métadonnées de titre et de description HTML de la page de destination. |
Matching rules object | Indique quelle(s) règle(s) ont fait correspondre les Posts reçus. L’objet renvoie le tag de règle et l’id de la règle dans l’objet de réponse. |
Poll metadata | Indique la présence d’un sondage dans un Post, inclut la liste des choix du sondage, ainsi que la durée du sondage et son heure d’expiration. |
Profile geo | Données de localisation de profil utilisateur dérivées, y compris les coordonnées [longitude, latitude] (lorsque possible) et les métadonnées de lieu associées. |
URL développées et enrichies
title
et de la description
de la page de destination.
Détails importants :
- Pour résoudre un lien raccourci, notre système envoie des requêtes HTTP HEAD à l’URL fournie et suit toutes les redirections jusqu’à l’URL finale. Cette URL finale (ET NON le contenu de la page elle‑même) est ensuite incluse dans la charge utile de la réponse.
- L’enrichissement d’URL ajoute entre 5 et 10 secondes de latence aux streams en temps réel
- Pour les requêtes effectuées à la Full Archive Search API, les données d’enrichissement des URL développées ne sont disponibles que pour les Posts âgés de 13 mois ou moins.
- L’enrichissement d’URL n’est pas disponible pour les liens de Post (y compris les Tweets cités), les liens Moments et les liens de profil inclus dans un Post.
Charge utile du Post
entities
de la charge utile du Post — plus précisément dans l’objet entitites.urls.unwound
. Il fournit les champs de metadata suivants :
- URL développée —
unwound.url
- Statut HTTP de l’URL développée —
unwound.status
- Titre HTML de l’URL développée — limite de 300 caractères —
unwound.title
- Description HTML de l’URL développée — limite de 1000 caractères —
unwound.description
Opérateurs de filtrage
- Exemple : “url:tennis”
- Correspondance tokenisée sur toute URL développée contenant le mot tennis
- Peut aussi servir de filtre pour inclure ou exclure les liens d’un site web spécifique, par exemple “url:npr.org”
- Exemple : “url_title:tennis”
- Correspondance tokenisée sur tout titre HTML d’URL développée contenant le mot tennis
- Correspond au titre HTML inclus dans la charge utile, limité à 300 caractères.
- Exemple : “url_description:tennis”
- Correspondance tokenisée sur toute description HTML d’URL développée contenant le mot tennis
- Correspond à la description HTML incluse dans la charge utile, limitée à 1000 caractères.
Codes d’état HTTP
- Atteignions un code de la série 200 (succès)
- Atteignions un code d’une série non redirection (échec)
- Expirions parce que l’URL finale n’a pas pu être résolue dans un délai raisonnable (renvoie un 408 — délai dépassé)
- Rencontrions une exception quelconque
Raison | Code d’état renvoyé |
---|---|
Exceptions SSL | 403 (Interdit) |
Déroulement non autorisé par l’URL | 405 |
Délai de socket dépassé | 408 (Délai dépassé) |
Exception d’hôte inconnu | 404 (Introuvable) |
Opération non prise en charge | 404 (Introuvable) |
Exception de connexion | 404 (Introuvable) |
Argument non valide | 400 (Mauvaise requête) |
Tout le reste | 400 (Mauvaise requête) |
Règles de correspondance
matching_rules
reflète toutes les règles qui ont fait correspondre le résultat. En d’autres termes, si plusieurs règles correspondent à un Post spécifique, il ne sera livré qu’une seule fois, mais l’élément matching_rules
contiendra l’ensemble des règles correspondantes.
Métadonnées de sondage
Détails importants :
- Disponible sur toutes les API Enterprise (PowerTrack, Replay, Search, Historical PowerTrack)
- Remarque : Pour Replay et Historical PowerTrack, ces metadata ont été disponibles pour la première fois le 22/02/2017.
- N’inclut pas les informations de vote ni les résultats de sondage
- Ne prend actuellement pas en charge les filtres/opérateurs
- Disponible uniquement en format natif enrichi
- Le format natif enrichi est un paramètre contrôlé par l’utilisateur qui peut être modifié à tout moment via la Console : Select a Product (PowerTrack, Replay, Search) > Settings tab > Output Format (Leave data in its original format)
Charge utile de Post
- Un tableau « options » avec jusqu’à quatre options, comprenant la position (1-4) et le libellé de l’option
- Date d’expiration du sondage
- Durée du sondage
Exemple de charge utile
Géo du profil
Introduction
Remarque : Certaines des géodonnées utilisées pour créer l’enrichissement Profile Geo proviennent de GeoNames.org et sont utilisées par X sous la licence Creative Commons Attribution 3.0.
Données de géolocalisation du profil
Nom du champ natif enrichi | Exemple de valeur | Description |
---|---|---|
user.derived.locations.country | United States | Le pays d’origine de l’utilisateur qui a créé le Post. |
user.derived.locations.country_code | US | Un code pays ISO-3166 à deux lettres correspondant au pays d’origine de l’utilisateur qui a créé le Post. |
user.derived.locations.locality | Birmingham | La localité (généralement la ville) d’origine de l’utilisateur qui a créé le Post. |
user.derived.locations.region | Alabama | La région (généralement l’État/la province) d’origine de l’utilisateur qui a créé le Post. |
user.derived.locations.sub_region | Jefferson County | La sous-région (généralement le comté) d’origine de l’utilisateur qui a créé le Post. |
user.derived.locations.full_name | Birmingham, Alabama, United States | Le nom complet (hors sous-région) du lieu d’origine de l’utilisateur qui a créé le Post. |
user.derived.locations.geo | Voir ci-dessous | Un tableau qui contient une valeur lat/long pour une coordonnée correspondant au niveau de granularité le plus fin du lieu d’origine de l’utilisateur qui a créé le Post. |
Exemple de payload
Limitations
- L’enrichissement Profile Geo cherche à déterminer le meilleur correspondant pour le lieu géographique indiqué dans la chaîne de localisation du profil. Le résultat peut ne pas être exact dans tous les cas, en raison de facteurs tels que l’existence de plusieurs lieux aux noms similaires ou de noms ambigus.
- Si aucune valeur n’est fournie dans le champ de localisation du profil de l’utilisateur (actor.location), nous n’essaierons pas d’établir de classification.
- Niveau de précision : si un enrichissement Profile Geo ne peut être déterminé avec confiance qu’au niveau du pays ou de la région, les géographies de niveau inférieur comme subRegion et locality seront omises du payload.
- L’enrichissement Profile Geo fournit des coordonnées lat/long (un point unique) correspondant au niveau de précision des résultats de l’enrichissement. Ces coordonnées représentent le centre géographique du lieu déterminé. Par exemple, si le niveau de précision est « pays », alors ces coordonnées sont définies sur le centre géographique de ce pays.
- Les opérateurs PowerTrack fournis pour les propriétés d’adresse (locality/region/country/country code) sont volontairement granuleux afin de permettre de nombreuses combinaisons de règles. Lorsque vous ciblez un lieu spécifique partageant son nom avec un autre, envisagez de combiner des règles d’adresse. Par exemple, ce qui suit évitera les correspondances pour “San Francisco, Philippines” : profile_locality:“San Francisco” profile_region:California. Lors de la création de règles qui ciblent des champs Profile Geo individuels, gardez à l’esprit que chaque niveau supplémentaire de granularité réduira le volume de résultats. Dans certains cas, lorsque vous cherchez à analyser des données d’une ville, vous pouvez choisir de vous appuyer uniquement sur une règle de région si celle-ci recouvre largement la ville; par exemple, la ville de Zurich, en Suisse, peut être ciblée efficacement, ainsi que ses environs, avec profile_region:“Zurich”.
- Utilisation avec les Posts « Native Geo » : l’enrichissement Profile Geo fournit un type alternatif de géographie pour un Post, différent de la valeur geo native dans le payload. Ces deux types de géographie peuvent être combinés pour capturer tous les Posts pertinents liés à une zone donnée (selon les géodonnées disponibles), bien qu’ils ne soient pas conceptuellement équivalents.