Panoramica
-
Entity annotations (NER): Le entità includono persone, luoghi, prodotti e organizzazioni e vengono fornite nella sezione del payload
entity
. Vengono assegnate in modo programmatico in base a ciò che è esplicitamente menzionato (riconoscimento di entità denominate) nel testo del Post. - Context annotations: Derivate dall’analisi del testo di un Post, le context annotations includono una coppia dominio‑entità per aiutare a scoprire Post su argomenti che in precedenza potevano essere difficili da far emergere. Attualmente utilizziamo oltre 80 domini per categorizzare i Post. Un file CSV delle entità di context annotation disponibili è reperibile nel nostro GitHub repository.
Tipi di annotazione dei Post
Entità
entities
e vengono restituite come annotations nel payload. Ogni annotazione ha un punteggio di attendibilità e indica in quale punto del testo del Post le entità sono state identificate (tramite i campi start
e end
).
I tipi di annotazioni delle entità includono:
- Persona - Esempi: Barack Obama, Daniel, George W. Bush
- Luogo - Esempi: Detroit, Cali, San Francisco
- Prodotto - Esempi: Mountain Dew, Mozilla Firefox
- Organizzazione - Esempi: Chicago White Sox, IBM
- Altro - Esempi: Diabete, Super Bowl 50
Contesto
context_annotations
del payload. Sono inferite tramite analisi semantica di parole chiave, hashtag, handle, ecc. nel testo del Post e producono etichette di dominio e/o entità. Attualmente utilizziamo oltre 80 domini, come mostrato nella tabella seguente.
Categorie di dominio | Codici di dominio |
---|---|
3: Programmi TV | 46: Categoria di brand |
4: Episodi TV | 47: Brand |
6: Eventi sportivi | 48: Prodotto |
10: Persona | 54: Musicista |
11: Sport | 55: Genere musicale |
12: Squadra sportiva | 56: Attore |
13: Luogo | 58: Personalità dell’intrattenimento |
22: Generi TV | 60: Atleta |
23: Canali TV | 65: Verticale interessi e hobby |
26: Lega sportiva | 66: Categoria interessi e hobby |
27: Partita di football americano | 67: Interessi e hobby |
28: Partita NFL | 68: Partita di hockey |
29: Eventi | 71: Videogioco |
31: Community | 78: Editore di videogiochi |
35: Politici | 79: Hardware per videogiochi |
38: Competizione politica | 83: Partita di cricket |
39: Partita di basket | 84: Libro |
40: Serie sportive | 85: Genere letterario |
43: Partita di calcio | 86: Film |
44: Partita di baseball | 87: Genere cinematografico |
45: Verticale di brand | 88: Organismo politico |
46: Categoria di brand | 89: Album musicale |
47: Brand | 90: Stazione radio |
48: Prodotto | 91: Podcast |
54: Musicista | 92: Personalità sportiva |
55: Genere musicale | 93: Allenatore |
56: Attore | 94: Giornalista |
58: Personalità dell’intrattenimento | 95: Canale TV [Entity Service] |
60: Atleta | 109: Tendenze ricorrenti |
65: Verticale interessi e hobby | 110: Account virali |
66: Categoria interessi e hobby | 114: Concerto |
67: Interessi e hobby | 115: Conferenza sui videogiochi |
68: Partita di hockey | 116: Torneo di videogiochi |
71: Videogioco | 117: Festival cinematografico |
78: Editore di videogiochi | 118: Cerimonia di premiazione |
79: Hardware per videogiochi | 119: Festività |
83: Partita di cricket | 120: Creator digitale |
84: Libro | 122: Personaggio di fantasia |
85: Genere letterario | 130: Franchise multimediale |
86: Film | 131: Tassonomia unificata di Twitter |
87: Genere cinematografico | 136: Personalità dei videogiochi |
88: Organismo politico | 137: Squadra eSports |
89: Album musicale | 138: Giocatore eSports |
90: Stazione radio | 139: Community di fan |
91: Podcast | 149: Lega eSports |
92: Personalità sportiva | 152: Cibo |
93: Allenatore | 155: Meteo |
94: Giornalista | 156: Città |
95: Canale TV [Entity Service] | 157: College e università |
109: Tendenze ricorrenti | 158: Punti di interesse |
110: Account virali | 159: Stati |
114: Concerto | 160: Paesi |
115: Conferenza sui videogiochi | 162: Esercizio e fitness |
116: Torneo di videogiochi | 163: Viaggi |
117: Festival cinematografico | 164: Campi di studio |
118: Cerimonia di premiazione | 165: Tecnologia |
119: Festività | 166: Azioni |
120: Creator digitale | 167: Animali |
122: Personaggio di fantasia | 171: Notizie locali |
130: Franchise multimediale | 172: Programma TV globale |
131: Tassonomia unificata di Twitter | 173: Tassonomia dei prodotti di Google |
136: Personalità dei videogiochi | 174: Asset digitali e crypto |
137: Squadra eSports | 175: Eventi di emergenza |
138: Giocatore eSports |
Richiedere le annotations
Esempio di richiesta
Esempio di risposta
App di esempio
Domande frequenti
Annotazioni di contesto
Come funzionano le annotations di contesto di Twitter?
Come funzionano le annotations di contesto di Twitter?
Come faccio a sapere che i vostri data sono completi e affidabili?
Come faccio a sapere che i vostri data sono completi e affidabili?
Come garantite la precisione?
Come garantite la precisione?
Come decidete cosa monitorare?
Come decidete cosa monitorare?
Quale supporto storico è disponibile con le annotations dei Tweet?
Quale supporto storico è disponibile con le annotations dei Tweet?
Twitter è in grado di annotare i Tweet in lingue diverse dall’inglese? Se sì, quali lingue sono supportate e la copertura dei Tweet annotati varia?
Twitter è in grado di annotare i Tweet in lingue diverse dall’inglese? Se sì, quali lingue sono supportate e la copertura dei Tweet annotati varia?
- Inglese (USA, Regno Unito)
- Giapponese (Giappone)
- Portoghese (Brasile)
- Spagnolo (Argentina, Messico, Spagna)
- Hindi (India)
- Arabo (Arabia Saudita)
- Turco (Turchia)
- Indonesiano (Indonesia)
- Russo (Russia)
- Francese (Francia)
- Tedesco (Germania)
- Tamil (India)
Rank | Country code | Country | % of Tweets annotated |
---|---|---|---|
1 | IN | India | 41% |
2 | VN | Vietnam | 36% |
3 | GB | Regno Unito | 36% |
4 | EC | Ecuador | 35% |
5 | PE | Perù | 33% |
6 | US | Stati Uniti | 32% |
7 | CA | Canada | 32% |
8 | AU | Australia | 31% |
9 | JP | Giappone | 31% |
10 | PH | Filippine | 30% |
11 | SG | Singapore | 30% |
12 | MY | Malesia | 30% |
13 | MX | Messico | 30% |
14 | GB | Regno Unito | 29% |
15 | NG | Nigeria | 29% |
Su quali “semantiche” di base si affida Twitter per annotare un Tweet?
Su quali “semantiche” di base si affida Twitter per annotare un Tweet?
- Account: possiamo annotare i tweet provenienti da un determinato handle o che menzionano tale handle
- Hashtag
- Parole chiave/frasi
Perché alcuni Tweet hanno entità associate mentre altri no?
Perché alcuni Tweet hanno entità associate mentre altri no?
- Alcuni Tweet non sono abbastanza ricchi dal punto di vista semantico da poter essere etichettati e non possono essere contrassegnati in base alle nostre attuali regole di annotazione
- Alcuni Tweet non sono pertinenti
- Il Tweet riguarda un argomento molto effimero che non è presente nel nostro grafo
- Non copriamo la lingua/il mercato
- Copriamo la lingua/il mercato, ma ci manca un argomento o un termine/account/hashtag specifico correlato a un argomento che già monitoriamo
Quando sono presenti più domini (per esempio, [3,30]), l’ID dell’entità rimane lo stesso?
Quando sono presenti più domini (per esempio, [3,30]), l’ID dell’entità rimane lo stesso?
Avete una timeline stabilita per il tracciamento di serie/film? In altre parole, per quanto tempo una serie/un film viene tracciato prima/dopo l’uscita?
Avete una timeline stabilita per il tracciamento di serie/film? In altre parole, per quanto tempo una serie/un film viene tracciato prima/dopo l’uscita?
I film dispongono di un filtro per area/lingua simile a quello per i programmi TV?
I film dispongono di un filtro per area/lingua simile a quello per i programmi TV?