Introdução
Enterprise
Os enriquecimentos Enterprise são metadados adicionais incluídos no corpo da resposta de algumas APIs de dados. Eles estão disponíveis apenas em planos de assinatura pagos.
A tabela abaixo apresenta uma breve descrição de cada enriquecimento:
Enrichment: | Descrição: |
---|---|
URLs expandidas e aprimoradas | Expande automaticamente URLs encurtadas (por exemplo, bitly) incluídas no corpo de um Post e fornece metadados de título e descrição em HTML da página de destino. |
Objeto de regras correspondentes | Indica quais regras corresponderam aos Posts recebidos. O objeto retorna a tag da regra e o id da regra no objeto de resposta. |
Metadados de enquete | Indica a presença de uma enquete em um Post, inclui a lista de opções da enquete e informa tanto a duração quanto o horário de expiração da enquete. |
Geolocalização de perfil | Dados derivados da localização do perfil do usuário, incluindo as coordenadas [longitude, latitude] (quando possível) e metadados do local relacionados. |
URLs Expandidas e Aprimoradas
title
e description
da página de destino.
Detalhes importantes:
- Para resolver um link encurtado, nosso sistema envia solicitações HTTP HEAD para a URL fornecida e segue os redirecionamentos até chegar à URL final. Essa URL final (NÃO o conteúdo da página em si) é então incluída no payload da resposta.
- O enriquecimento de URL adiciona entre 5 e 10 segundos de latência a streams em tempo real
- Para solicitações feitas à Full Archive Search API, os dados de enriquecimento de URL expandida estão disponíveis apenas para Posts com até 13 meses.
- O enriquecimento de URL não está disponível para links de Post (incluindo Tweets com citação), links de Moments e links de perfil incluídos em um Post.
Payload do Post
entities
do payload do Post — especificamente no objeto entities.urls.unwound
. Ele fornece os seguintes campos de metadata:
- URL expandida -
unwound.url
- Status HTTP expandido -
unwound.status
- Título HTML da URL expandida - limite de 300 caracteres -
unwound.title
- Descrição HTML da URL expandida - limite de 1000 caracteres -
unwound.description
Operadores de filtragem
- Exemplo: “url:tennis”
- Correspondência tokenizada em qualquer Expanded URL que inclua a palavra tennis
- Também pode ser usado como filtro para incluir ou excluir links de um site específico usando algo como “url:npr.org”
- Exemplo: “url_title:tennis”
- Correspondência tokenizada em qualquer título HTML da Expanded URL que inclua a palavra tennis
- Faz correspondência com os dados do título HTML incluídos no payload, limitado a 300 caracteres.
- Exemplo: “url_description:tennis”
- Correspondência tokenizada em qualquer descrição HTML da Expanded URL que inclua a palavra tennis
- Faz correspondência com a descrição HTML incluída no payload, limitada a 1000 caracteres.
Códigos de status HTTP
- Atinjamos um código da série 200 (sucesso)
- Atinjamos um código de série que não seja de redirecionamento (falha)
- Ocorra um timeout porque a URL final não pôde ser resolvida em um tempo razoável (retorna 408 — timeout)
- Ocorra algum tipo de exceção
Motivo | Código de status retornado |
---|---|
Exceções de SSL | 403 (Forbidden) |
Resolução não permitida pela URL | 405 |
Timeout de socket | 408 (Timeout) |
Exceção de host desconhecido | 404 (Not Found) |
Operação não suportada | 404 (Not Found) |
Exceção de conexão | 404 (Not Found) |
Argumento inválido | 400 (Bad Request) |
Qualquer outro caso | 400 (Bad Request) |
Regras de correspondência
matching_rules
reflete todas as regras que correspondem ao resultado em questão. Em outras palavras, se mais de uma regra corresponder a um Post específico, ele será entregue apenas uma vez, mas o elemento matching_rules
incluirá todas as regras que corresponderam.
Metadados de enquete
Detalhes importantes:
- Disponível em todas as APIs Enterprise (PowerTrack, Replay, Search, Historical PowerTrack)
- Observação: Para Replay e Historical PowerTrack, esse metadata foi disponibilizado pela primeira vez em 22/02/2017.
- Não inclui informações de voto nem resultados de enquete
- Atualmente não há suporte a filtros/operadores
- Disponível apenas em formato nativo enriquecido
- O formato nativo enriquecido é uma configuração controlada pelo usuário que pode ser alterada a qualquer momento pelo Console: Select a Product (PowerTrack, Replay, Search) > Settings tab > Output Format (Leave data in its original format)
Payload de Post
- Um array “options” com até quatro opções, incluindo a posição (1–4) e o texto da opção
- Data de expiração da enquete
- Duração da enquete
Exemplo de Payload
Geolocalização do perfil
Introdução
Nota: Alguns dos geodados de suporte usados para criar o enriquecimento Profile Geo vêm de GeoNames.org e são usados pela X sob a Licença Creative Commons Attribution 3.0.
Dados geográficos de perfil
Enriched native field name | Example value | Description |
---|---|---|
user.derived.locations.country | United States | O país de origem do usuário que criou o Post. |
user.derived.locations.country_code | US | Um código de país ISO-3166 de duas letras que corresponde ao país de origem do usuário que criou o Post. |
user.derived.locations.locality | Birmingham | A localidade (geralmente a cidade) de origem do usuário que criou o Post. |
user.derived.locations.region | Alabama | A região (geralmente estado/província) de origem do usuário que criou o Post. |
user.derived.locations.sub_region | Jefferson County | A sub-região (geralmente condado) de origem do usuário que criou o Post. |
user.derived.locations.full_name | Birmingham, Alabama, United States | O nome completo (excluindo a sub-região) do local de origem do usuário que criou o Post. |
User.derived.locations.geo | See Below | Um array que inclui um valor de latitude/longitude para uma coordenada que corresponde ao nível de granularidade mais baixo do local de origem do usuário que criou o Post. |
Exemplo de payload
Limitações
- O enriquecimento Profile Geo tenta determinar a melhor correspondência para o local geográfico descrito na string de localização do perfil. O resultado pode não ser preciso em todos os casos devido a fatores como múltiplos locais com nomes semelhantes ou nomes ambíguos.
- Se não houver valor no campo de localização do perfil do usuário (actor.location), não tentaremos fazer uma classificação.
- Nível de precisão: se um Profile Geo Enrichment só puder ser determinado com confiança nos níveis de país ou região, geografias de nível inferior, como subRegion e localidade, serão omitidas do payload.
- O enriquecimento Profile Geo fornece coordenadas de latitude/longitude (um único ponto) que correspondem ao nível de precisão dos resultados do enriquecimento. Essas coordenadas representam o centro geográfico dos resultados de localização do enriquecimento. Por exemplo, se o nível de precisão for País, essas coordenadas serão definidas para o centro geográfico desse país.
- Os operadores PowerTrack fornecidos para propriedades de endereço (locality/region/country/country code) são intencionalmente granulares para permitir muitas combinações de regras. Ao tentar segmentar um local específico que compartilha nome com outro, considere combinar regras de endereço. Por exemplo, o seguinte evitaria correspondências para “San Francisco, Philippines”: profile_locality:“San Francisco” profile_region:California. Ao criar regras que segmentam campos individuais de Profile Geo, lembre-se de que cada aumento no nível de granularidade limitará os resultados que você verá. Em alguns casos, ao analisar dados de uma cidade, talvez você prefira depender apenas de uma regra de região quando a região tiver sobreposição significativa com a cidade; por exemplo, a cidade de Zurique, Suíça, pode ser efetivamente segmentada junto com áreas ao redor com profile_region:“Zurich”.
- Uso com Posts com geolocalização nativa: o enriquecimento Profile Geo fornece um tipo alternativo de geografia para um Post, diferente do valor de geolocalização nativo no payload. Esses dois tipos de geografia podem ser combinados para capturar todos os Posts possíveis relacionados a uma determinada área (com base nos geodados disponíveis), embora não sejam conceitualmente equivalentes.