Visão geral
-
Entity annotations (NER): As entidades incluem pessoas, lugares, produtos e organizações e são fornecidas na seção de payload
entity
. Elas são atribuídas programaticamente com base no que é mencionado explicitamente (reconhecimento de entidades nomeadas) no texto do Post. - Context annotations: Derivadas da análise do texto de um Post, as context annotations incluem um pareamento de domínio e entidade para ajudar a descobrir Posts sobre tópicos que anteriormente podiam ser difíceis de identificar. Atualmente usamos mais de 80 domínios para categorizar Posts. Um arquivo CSV com as entidades de context annotations disponíveis está em nosso repositório no GitHub.
Tipos de Anotação de Post
Entidades
entities
e aparecem como annotations no payload. Cada anotação tem uma pontuação de confiança e indica onde, no texto do Post, as entidades foram identificadas (usando os campos start
e end
).
Os tipos de anotação de entidade incluem:
- Pessoa - Exemplos: Barack Obama, Daniel, George W. Bush
- Lugar - Exemplos: Detroit, Cali, San Francisco
- Produto - Exemplos: Mountain Dew, Mozilla Firefox
- Organização - Exemplos: Chicago White Sox, IBM
- Outro - Exemplos: Diabetes, Super Bowl 50
Contexto
context_annotations
do payload. Elas são inferidas com base na análise semântica de palavras‑chave, hashtags, handles etc. no texto do Post e resultam em rótulos de domínio e/ou de entidade. Atualmente, usamos mais de 80 domínios, conforme mostrado na tabela abaixo.
Categorias de Domínio | Códigos de Domínio |
---|---|
3: Programas de TV | 46: Categoria de Marca |
4: Episódios de TV | 47: Marca |
6: Eventos esportivos | 48: Produto |
10: Pessoa | 54: Músico |
11: Esporte | 55: Gênero musical |
12: Time esportivo | 56: Ator |
13: Lugar | 58: Personalidade do entretenimento |
22: Gêneros de TV | 60: Atleta |
23: Canais de TV | 65: Vertical de interesses e hobbies |
26: Liga esportiva | 66: Categoria de interesses e hobbies |
27: Jogo de futebol americano | 67: Interesses e hobbies |
28: Jogo de futebol da NFL | 68: Jogo de hóquei |
29: Eventos | 71: Videogame |
31: Comunidade | 78: Publicadora de videogames |
35: Políticos | 79: Hardware de videogame |
38: Disputa política | 83: Partida de críquete |
39: Jogo de basquete | 84: Livro |
40: Série esportiva | 85: Gênero literário |
43: Partida de futebol | 86: Filme |
44: Jogo de beisebol | 87: Gênero de filme |
45: Vertical de marca | 88: Órgão político |
46: Categoria de marca | 89: Álbum musical |
47: Marca | 90: Estação de rádio |
48: Produto | 91: Podcast |
54: Músico | 92: Personalidade esportiva |
55: Gênero musical | 93: Técnico/treinador |
56: Ator | 94: Jornalista |
58: Personalidade do entretenimento | 95: Canal de TV [Entity Service] |
60: Atleta | 109: Tendências recorrentes |
65: Vertical de interesses e hobbies | 110: Contas virais |
66: Categoria de interesses e hobbies | 114: Show/concerto |
67: Interesses e hobbies | 115: Conferência de videogame |
68: Jogo de hóquei | 116: Torneio de videogame |
71: Videogame | 117: Festival de cinema |
78: Publicadora de videogames | 118: Premiação |
79: Hardware de videogame | 119: Feriado |
83: Partida de críquete | 120: Criador digital |
84: Livro | 122: Personagem fictício |
85: Gênero literário | 130: Franquia multimídia |
86: Filme | 131: Taxonomia unificada do Twitter |
87: Gênero de filme | 136: Personalidade de videogame |
88: Órgão político | 137: Time de eSports |
89: Álbum musical | 138: Jogador de eSports |
90: Estação de rádio | 139: Comunidade de fãs |
91: Podcast | 149: Liga de eSports |
92: Personalidade esportiva | 152: Comida |
93: Técnico/treinador | 155: Clima |
94: Jornalista | 156: Cidades |
95: Canal de TV [Entity Service] | 157: Faculdades e universidades |
109: Tendências recorrentes | 158: Pontos de interesse |
110: Contas virais | 159: Estados |
114: Show/concerto | 160: Países |
115: Conferência de videogame | 162: Exercício e fitness |
116: Torneio de videogame | 163: Viagem |
117: Festival de cinema | 164: Campos de estudo |
118: Premiação | 165: Tecnologia |
119: Feriado | 166: Ações |
120: Criador digital | 167: Animais |
122: Personagem fictício | 171: Notícias locais |
130: Franquia multimídia | 172: Programa de TV global |
131: Taxonomia unificada do Twitter | 173: Taxonomia de produtos do Google |
136: Personalidade de videogame | 174: Ativos digitais e cripto |
137: Time de eSports | 175: Eventos de emergência |
138: Jogador de eSports |
Solicitando annotations
Exemplo de requisição
Exemplo de resposta
App de exemplo
Perguntas frequentes
Anotações de contexto
Como funcionam as annotations de context do Twitter?
Como funcionam as annotations de context do Twitter?
Como posso saber se seus data são completos e confiáveis?
Como posso saber se seus data são completos e confiáveis?
Como você garante a precisão?
Como você garante a precisão?
Como você decide o que acompanhar?
Como você decide o que acompanhar?
Que suporte histórico está disponível com as annotations de Tweet?
Que suporte histórico está disponível com as annotations de Tweet?
O Twitter consegue anotar Tweets em idiomas que não sejam o inglês? Se sim, quais idiomas e a cobertura de Tweets anotados muda?
O Twitter consegue anotar Tweets em idiomas que não sejam o inglês? Se sim, quais idiomas e a cobertura de Tweets anotados muda?
- English (US, UK)
- Japanese (Japan)
- Portuguese (Brazil)
- Spanish (Argentina, Mexico, Spain)
- Hindi (India)
- Arabic (Saudi Arabia)
- Turkish (Turkey)
- Indonesian (Indonesia)
- Russian (Russia)
- French (France)
- German (Germany)
- Tamil (India)
Classificação | Código do país | País | % de Tweets anotados |
---|---|---|---|
1 | IN | Índia | 41% |
2 | VN | Vietnã | 36% |
3 | GB | Grã-Bretanha | 36% |
4 | EC | Equador | 35% |
5 | PE | Peru | 33% |
6 | US | Estados Unidos | 32% |
7 | CA | Canadá | 32% |
8 | AU | Austrália | 31% |
9 | JP | Japão | 31% |
10 | PH | Filipinas | 30% |
11 | SG | Singapura | 30% |
12 | MY | Malásia | 30% |
13 | MX | México | 30% |
14 | GB | Grã-Bretanha | 29% |
15 | NG | Nigéria | 29% |
Quais “semânticas” subjacentes o Twitter utiliza para anotar um Tweet?
Quais “semânticas” subjacentes o Twitter utiliza para anotar um Tweet?
- Contas — podemos anotar tweets de um determinado handle ou que mencionem esse handle
- Hashtags
- Palavras‑chave/frases
Por que alguns Tweets têm entidades associadas a eles enquanto outros não têm?
Por que alguns Tweets têm entidades associadas a eles enquanto outros não têm?
- Alguns Tweets não têm riqueza semântica suficiente para serem rotulados e não podem ser marcados segundo nossas regras de anotação atuais
- Alguns Tweets não são relacionados a nenhum tópico
- O Tweet trata de um tópico muito efêmero que não está no nosso grafo
- Não cobrimos o idioma/mercado
- Cobrimos o idioma/mercado, mas está faltando um tópico ou um termo/conta/hashtag específico relacionado a um tópico que já acompanhamos
Quando há vários domínios (por exemplo, [3,30]), o Entity ID permanece o mesmo?
Quando há vários domínios (por exemplo, [3,30]), o Entity ID permanece o mesmo?
Vocês têm um cronograma definido para o acompanhamento de séries/filmes? Em outras palavras, por quanto tempo uma série/um filme é acompanhado antes/depois do lançamento?
Vocês têm um cronograma definido para o acompanhamento de séries/filmes? Em outras palavras, por quanto tempo uma série/um filme é acompanhado antes/depois do lançamento?
Os filmes têm um filtro de localidade semelhante ao disponível para programas de TV?
Os filmes têm um filtro de localidade semelhante ao disponível para programas de TV?