Übersicht
-
Entity-Annotations (NER): Entities umfassen Personen, Orte, Produkte und Organisationen und werden im
entity
-Payload-Abschnitt bereitgestellt. Sie werden programmatisch basierend auf dem, was im Post-Text ausdrücklich erwähnt wird (Named-Entity Recognition), zugewiesen. - Context-Annotations: Abgeleitet aus der Analyse des Textes eines Posts enthalten Context-Annotations eine Kombination aus Domain und Entity, um Posts zu Themen zu entdecken, die zuvor möglicherweise schwer auffindbar waren. Wir verwenden derzeit über 80 Domains, um Posts zu kategorisieren. Eine CSV-Datei der verfügbaren Context-Annotation-Entities ist in unserem GitHub-Repository verfügbar.
Post-Annotationstypen
Entities
entities
-Felds und werden im Payload als Annotations wiedergegeben. Jede Annotation hat einen Konfidenzwert und gibt an, wo im Post-Text die Entitäten identifiziert wurden (mithilfe der Felder start
und end
).
Die Typen von Entitätsannotationen umfassen:
- Person - Beispiele: Barack Obama, Daniel, George W. Bush
- Ort - Beispiele: Detroit, Cali, San Francisco
- Produkt - Beispiele: Mountain Dew, Mozilla Firefox
- Organisation - Beispiele: Chicago White Sox, IBM
- Sonstiges - Beispiele: Diabetes, Super Bowl 50
Kontext
context_annotations
der Nutzlast bereitgestellt. Sie werden auf Grundlage einer semantischen Analyse von Schlüsselwörtern, Hashtags, Handles usw. im Post-Text abgeleitet und führen zu Domänen- und/oder Entitätslabels. Derzeit verwenden wir über 80 Domänen, wie in der Tabelle unten gezeigt.
Domänenkategorien | Domänencodes |
---|---|
3: TV-Sendungen | 46: Markenkategorie |
4: TV-Episoden | 47: Marke |
6: Sportereignisse | 48: Produkt |
10: Person | 54: Musiker |
11: Sport | 55: Musikgenre |
12: Sportteam | 56: Schauspieler |
13: Ort | 58: Unterhaltungspersönlichkeit |
22: TV-Genres | 60: Athlet |
23: TV-Kanäle | 65: Interessen- und Hobby-Vertical |
26: Sportliga | 66: Interessen- und Hobby-Kategorie |
27: American-Football-Spiel | 67: Interessen und Hobbys |
28: NFL-Spiel | 68: Hockeyspiel |
29: Ereignisse | 71: Videospiel |
31: Community | 78: Videospiel-Publisher |
35: Politiker | 79: Videospiel-Hardware |
38: Wahlkampf | 83: Cricket-Spiel |
39: Basketballspiel | 84: Buch |
40: Sportserie | 85: Buchgenre |
43: Fußballspiel | 86: Film |
44: Baseballspiel | 87: Filmgenre |
45: Marken-Vertical | 88: Politisches Gremium |
46: Markenkategorie | 89: Musikalbum |
47: Marke | 90: Radiosender |
48: Produkt | 91: Podcast |
54: Musiker | 92: Sportpersönlichkeit |
55: Musikgenre | 93: Trainer |
56: Schauspieler | 94: Journalist |
58: Unterhaltungspersönlichkeit | 95: TV-Kanal [Entity Service] |
60: Athlet | 109: Wiederkehrende Trends |
65: Interessen- und Hobby-Vertical | 110: Virale Accounts |
66: Interessen- und Hobby-Kategorie | 114: Konzert |
67: Interessen und Hobbys | 115: Videospielkonferenz |
68: Hockeyspiel | 116: Videospielturnier |
71: Videospiel | 117: Filmfestival |
78: Videospiel-Publisher | 118: Preisverleihung |
79: Videospiel-Hardware | 119: Feiertag |
83: Cricket-Spiel | 120: Digitaler Creator |
84: Buch | 122: Fiktive Figur |
85: Buchgenre | 130: Multimedia-Franchise |
86: Film | 131: Vereinheitlichte Twitter-Taxonomie |
87: Filmgenre | 136: Videospielpersönlichkeit |
88: Politisches Gremium | 137: Esports-Team |
89: Musikalbum | 138: Esports-Spieler |
90: Radiosender | 139: Fan-Community |
91: Podcast | 149: Esports-Liga |
92: Sportpersönlichkeit | 152: Lebensmittel |
93: Trainer | 155: Wetter |
94: Journalist | 156: Städte |
95: TV-Kanal [Entity Service] | 157: Hochschulen & Universitäten |
109: Wiederkehrende Trends | 158: Sehenswürdigkeiten |
110: Virale Accounts | 159: Bundesstaaten |
114: Konzert | 160: Länder |
115: Videospielkonferenz | 162: Bewegung & Fitness |
116: Videospielturnier | 163: Reisen |
117: Filmfestival | 164: Studienfächer |
118: Preisverleihung | 165: Technologie |
119: Feiertag | 166: Aktien |
120: Digitaler Creator | 167: Tiere |
122: Fiktive Figur | 171: Lokale Nachrichten |
130: Multimedia-Franchise | 172: Globale TV-Sendung |
131: Vereinheitlichte Twitter-Taxonomie | 173: Google-Produkt-Taxonomie |
136: Videospielpersönlichkeit | 174: Digitale Vermögenswerte & Krypto |
137: Esports-Team | 175: Notfallereignisse |
138: Esports-Spieler |
Annotations anfordern
Beispielanfrage
Beispielantwort
Beispiel-App
Häufige Fragen
Kontext-Annotations
Wie funktionieren die Twitter-Kontext-Annotations?
Wie funktionieren die Twitter-Kontext-Annotations?
Woher weiß ich, dass eure data vollständig und vertrauenswürdig sind?
Woher weiß ich, dass eure data vollständig und vertrauenswürdig sind?
Wie stellen Sie die Genauigkeit sicher?
Wie stellen Sie die Genauigkeit sicher?
Wie entscheiden Sie, was nachverfolgt werden soll?
Wie entscheiden Sie, was nachverfolgt werden soll?
Welche historische Unterstützung ist mit Tweet-Annotations verfügbar?
Welche historische Unterstützung ist mit Tweet-Annotations verfügbar?
Kann Twitter Tweets in nicht englischen Sprachen annotieren? Falls ja, welche Sprachen werden unterstützt und ändert sich die Abdeckung der annotierten Tweets?
Kann Twitter Tweets in nicht englischen Sprachen annotieren? Falls ja, welche Sprachen werden unterstützt und ändert sich die Abdeckung der annotierten Tweets?
- Englisch (USA, UK)
- Japanisch (Japan)
- Portugiesisch (Brasilien)
- Spanisch (Argentinien, Mexiko, Spanien)
- Hindi (Indien)
- Arabisch (Saudi-Arabien)
- Türkisch (Türkei)
- Indonesisch (Indonesien)
- Russisch (Russland)
- Französisch (Frankreich)
- Deutsch (Deutschland)
- Tamil (Indien)
Rang | Ländercode | Land | % der annotierten Tweets |
---|---|---|---|
1 | IN | Indien | 41% |
2 | VN | Vietnam | 36% |
3 | GB | Großbritannien | 36% |
4 | EC | Ecuador | 35% |
5 | PE | Peru | 33% |
6 | US | Vereinigte Staaten | 32% |
7 | CA | Kanada | 32% |
8 | AU | Australien | 31% |
9 | JP | Japan | 31% |
10 | PH | Philippinen | 30% |
11 | SG | Singapur | 30% |
12 | MY | Malaysia | 30% |
13 | MX | Mexiko | 30% |
14 | GB | Großbritannien | 29% |
15 | NG | Nigeria | 29% |
Auf welche zugrunde liegende „Semantik“ stützt sich Twitter, um einen Tweet zu annotieren?
Auf welche zugrunde liegende „Semantik“ stützt sich Twitter, um einen Tweet zu annotieren?
- Accounts – wir können tweets eines bestimmten Handles oder mit Erwähnung dieses Handles annotieren
- Hashtags
- Schlüsselwörter/Phrasen
Warum sind einigen Tweets Entitäten zugeordnet, während anderen keine zugeordnet sind?
Warum sind einigen Tweets Entitäten zugeordnet, während anderen keine zugeordnet sind?
- Einige Tweets sind semantisch nicht aussagekräftig genug, um gekennzeichnet zu werden, und können mit unseren aktuellen Annotierungsregeln nicht getaggt werden
- Einige Tweets sind thematisch nicht relevant
- Der Tweet bezieht sich auf ein sehr kurzlebiges Thema, das nicht in unserem Graph enthalten ist
- Wir decken die Sprache/den Markt nicht ab
- Wir decken die Sprache/den Markt ab, es fehlt uns jedoch ein Thema oder ein spezifischer Begriff/Account/Hashtag, der mit einem Thema zusammenhängt, das wir bereits tracken
Wenn es mehrere Domains gibt (zum Beispiel [3,30]), bleibt die Entity-ID gleich?
Wenn es mehrere Domains gibt (zum Beispiel [3,30]), bleibt die Entity-ID gleich?
Haben Sie einen festgelegten Zeitrahmen für die Nachverfolgung von Serien/Filmen? Anders ausgedrückt: Wie lange wird eine Serie/ein Film vor bzw. nach der Veröffentlichung nachverfolgt?
Haben Sie einen festgelegten Zeitrahmen für die Nachverfolgung von Serien/Filmen? Anders ausgedrückt: Wie lange wird eine Serie/ein Film vor bzw. nach der Veröffentlichung nachverfolgt?
Gibt es für Filme einen Gebietsschema-Filter, der dem für TV‑Sendungen entspricht?
Gibt es für Filme einen Gebietsschema-Filter, der dem für TV‑Sendungen entspricht?