企业版规则与查询入门
OR 表示。
每条规则最长 2,048 个字符,对正向子句(希望匹配或筛选的内容)和负向子句(希望排除且不匹配的内容)的数量不设上限。
构建规则与查询
关键词匹配 关键词匹配类似于搜索界面中的查询。例如,以下企业版运算符规则将匹配正文中包含“social”一词的活动。social
用空格实现 AND 逻辑
添加另一个关键词等同于增加一条匹配条件。例如,此规则仅匹配文本中同时出现“social”和“media”的活动,顺序不限——在术语之间留一个空格即表示布尔 AND 逻辑。如果在规则中显式写 AND,规则端点会拒绝该规则。
social media
用大写 OR 实现 OR 逻辑
许多情况下需要布尔 OR 逻辑,这也很容易实现。请注意,OR 运算符必须为大写,若使用小写 “or” 则会被视为普通关键词。
social OR data
否定术语
有些场景需要排除包含特定关键词的结果(布尔 NOT 逻辑)。例如,包含 “happy” 的活动,但排除正文中包含 “birthday” 的任何活动。
social -personality
使用括号分组
可以通过括号分组组合这些逻辑,并扩展为更复杂的查询。
(social OR data) (academic OR research) -personality -information -university
这只是开始——上述示例仅依赖于对关键词的分词匹配,企业版产品还提供运算符,可在文本上执行不同类型的匹配。
精确匹配
"social media research"
子串匹配
contains:info
邻近匹配
"social media research"~3
此外,其他运算符还允许你根据社交数据的独特属性(不仅限于文本)进行筛选。
发布 Post 的用户
from:XDeveloeprs
距离美国科罗拉多州博尔德市 Pearl St. 方圆 10 英里内、带地理标签的 Tweet
point_radius:[-105.27346517 40.01924738 10.0mi]
综合应用
这些可以与文本过滤器结合使用,逻辑与上述说明相同。
(social OR data) (academic OR research OR "social media research") point_radius:[-105.27346517 40.01924738 10.0mi] lang:en -personality -information -university
布尔语法
| 逻辑类型 | 运算符语法 | 说明 |
| AND | social data | 在两个运算符之间留空格,即表示它们之间为 AND 逻辑。 匹配同时包含两个关键词(“social”、“data”)的活动。 不要在规则中显式使用 AND。只使用空格。显式写出的 AND 会被当作普通关键词处理。 |
| OR | social OR data | 要将两个运算符进行 OR 连接,请在它们之间插入用空格分隔的全大写 OR。 匹配包含任一关键词(“social” 或 “data”)的活动。 注意,如果你在单条规则中同时使用 OR 和 AND,请先理解“运算顺序”一节所述的优先级,并按下文所述使用括号将非取反的运算符分组,以确保规则按预期工作。 你必须在规则中使用大写的 “OR”;小写的 ‘or’ 会被视为普通关键词。 |
| NOT | social data -apple -android -phone | 在运算符或一组运算符前紧接着插入 - 字符。 上述示例规则匹配包含关键词 “social” 的活动,但排除包含关键词 “data” 的活动。 不允许使用会请求“firehose 中除取反项以外的全部内容”的取反 OR。例如, apple OR -ipad 无效,因为它会匹配除提到 “ipad” 之外的所有活动。 |
| 分组 | (social OR data) -XDeveloeprs -api | 使用括号包裹多个运算符可创建一个功能性“分组”。 分组可像单个子句一样,通过空格(AND)或 OR 与其他子句连接。不过,最佳实践是不对整个分组统一取反(即不对整组加 -)。相反,应分别对每个运算符取反,并用空格(AND)串联。 例如,不要使用 -(iphone OR imac OR macbook),而应使用:-iphone -imac -macbook。 当单条规则同时包含 AND 和 OR 时,分组尤为重要,因为规则按特定的运算顺序进行评估。详见下文。 |
has:hashtags 运算符表示“我希望包含带有话题标签的活动”。
负向运算符 定义你希望从结果中排除的内容,通过上述布尔 NOT 逻辑实现。例如,-has:hashtags 表示“排除任何包含话题标签的活动,即使它们在其他方面符合我的规则”。
高级运算符产品对正向和负向子句的数量不设限制,但规则长度最多为 2,048 个字符。
运算顺序
- 先合并由 AND 逻辑连接的运算符
- 再应用由 OR 逻辑连接的运算符
apple OR iphone ipad会被评估为apple OR (iphone ipad)ipad iphone OR android会被评估为(iphone ipad) OR android
(apple OR iphone) ipadiphone (ipad OR android)
标点、变音符号与大小写敏感性
Diacr**í**tica 或话题标签 #cumplea**ñ**os 的规则将匹配 “Diacrítica” 或 “#cumpleaños”,但不会匹配缺少重音符号 í 或字母 ñ 的 “Diacritica” 或 “#cumpleanos”。
带有重音或变音符号的字符与普通字符同等对待,不视为词边界。例如,规则 cumpleaños 只会匹配包含单词 cumpleaños 的活动,不会匹配包含 cumplea、cumplean 或 os 的活动。
所有运算符的评估均不区分大小写。例如,规则 Cat 将匹配以下所有内容:“cat”、“CAT”、“Cat”。
如我们在“匹配规则”页面所述,每条规则都可以带有一个标签。标签本身不会影响过滤,但可用于在你的应用中对规则进行逻辑分组。每条规则只能有一个标签,且长度最多为 255 个字符。按照“匹配规则”页面的说明,通过 API 创建规则时,应在 JSON 格式的规则对象中一并包含标签。
以 JSON 格式编写规则
{"value":"insert_rule_here"}
包含双引号的规则
如果规则中包含用于精确匹配或其他运算符的双引号字符(“"),必须使用反斜杠进行转义,以将其与 JSON 结构区分开来。
"social data" @XDevelopers
该规则的 JSON 格式为:
{"value":"\"social data\" @XDevelopers"}
包含双引号字符串字面量的规则
若要在精确匹配中将双引号字符作为字符串字面量包含在内,必须进行双重转义。例如,对于匹配精确短语 “Toys “R” Us” 的规则(包括围绕 “R” 的双引号),其纯文本表示如下:
"Toys \"R\" Us"
将其转换为 JSON 格式时,应使用以下结构:
{"value":"\"Toys \\\"R\\\" Us\""}
带有标签的规则
要为规则添加一个可选标签,如上所述,只需在规则值中包含一个额外的 tag 字段。
{"value":"\"social data\" @XDevelopers","tag":"RULE-TAG-01"}
API 请求的格式
通过 API 向流中添加或删除规则时,多个 JSON 格式的规则应使用逗号分隔,并包装在一个 JSON “rules” 数组中,如下所示:
{"rules":[{"value":"from:XDevelopers"},{"value":"\"social data\" @XDevelopers","tag":"RULE-TAG-01"}]}
匹配引用 Tweet 的运算符
KeywordsPhrasesProximity#hashtags@mentions$cashtagsurl:url_contains:has:linkshas:mentionshas:hashtagshas:mediahas:symbolsis:quoteis:reply
企业版运算符
| 操作符 | 说明 |
|---|---|
| 关键字 | 在 Post 的正文或 URL 中匹配关键字。关键字必须以数字(0-9)或任意非标点字符开头。 关键词匹配采用分词方式进行,这意味着会将关键词与 Post 正文的分词结果进行匹配。 对于带有标点符号的字符串(例如,“可口可乐”),请使用带引号的”精确短语匹配”。 示例: (social OR pizza OR wildfire) -planet |
| 表情符号 | 在 Post 正文中匹配表情符号,使用基于标点、符号/表情和分隔符字符的分词式匹配。 如果某个表情符号存在变体,请用引号进行精确匹配。 示例: (🍕 OR 💜 OR 🐢) -🤖 |
| ”精确短语匹配” | 在 Post 正文中匹配精确短语。标点符号视为空白字符处理。 示例: ("social media" OR "developer.x.com" OR "wildfire911" OR "coca-cola") -"planet earth" |
| # | 匹配任何包含指定话题标签的 Post。为精确匹配,这意味着#2016将匹配包含以下内容的 Post#2016但不#2016大选。示例: (#social OR #pizza OR #2016election) -#planet |
| @ | 匹配任何提及指定用户名的 Post。 示例: (@XDevelopers OR @api OR @twittereng) -@jack |
| ”keyword1 keyword2”~N | 用于匹配关键字彼此相距不超过 N 个 token 的 Post 的近邻运算符。 按相反顺序出现的关键词之间的间隔不得超过 N-2 个 token。N 不得大于 6。 示例: "social media"~5 OR "API"~3 |
| 包含: | 对正文中包含指定子串的 Posts 进行子串匹配,不受分词影响。 对包含空格或标点符号的子字符串请使用双引号。 示例: (contains:social OR contains:"wikipedia.com") -contains:"buy now" |
| 发件人: | 匹配来自特定用户的任何 Post,可通过 X 数字账户 ID 或用户名进行匹配(不包括@)。示例: (from:2244994945 OR from:api OR from:twittereng) -from:jack |
| 收件人: | 匹配任何回复特定用户的 Post,可按 X 数字 Account ID 或用户名匹配(不包含@)。示例: (to:2244994945 OR to:api OR to:twittereng) -to:jack |
| url: | 对 Post 的展开 URL 执行基于分词的(关键词/短语)匹配。 示例: @XDevelopers url:"developer.x.com" |
| URL_标题: | 对展开后的 URL 的 HTML 标题元数据执行关键词/短语匹配。 仅适用于 PowerTrack 与 Historical PowerTrack。 |
| URL_description: | 在扩展的页面描述元数据中执行关键字/短语匹配。 仅在 PowerTrack 和 Historical PowerTrack 中可用。 |
| url_包含: | 匹配其 URL 包含指定短语或关键词的 Post。 将包含标点的搜索词用引号括起来。 示例: (url_contains:"developer.x.com" OR url_contains:wildfire) -url_contains:reddit |
| 简介: | 在 Post 的用户简介中匹配关键词或短语。这是基于分词的匹配,位于’说明’位于该…中的字段用户对象。 示例: (bio:engineer OR bio:"wordpress.com" OR bio:🚀) -bio:troll*注意:*仅适用于 PowerTrack 和 Historical PowerTrack。 |
| 简介_名称: | 匹配 Post 的用户个人资料名称中的关键词。这是在用户“name”字段内进行的分词匹配。 注意: 仅适用于 PowerTrack 和 Historical PowerTrack。用户对象。 *注:*仅在 PowerTrack 和 Historical PowerTrack 中可用。 |
| 个人简介_位置: | 匹配其用户对象为……的帖子’的位置包含指定的关键字或短语。 此运算符执行基于分词的匹配,类似于应用于消息正文的常规关键字规则。 此位置是……的一部分User 对象,并且是该账号’s’首页’位置。 *注意:*仅适用于 PowerTrack 与 Historical PowerTrack。 |
| 状态集_计数 | 当作者在指定范围内发布的状态数符合条件时,匹配 Post。 如果仅指定一个数字,则会匹配任何大于或等于该数字的数值。 可以指定一个范围以匹配该范围内的任意数字(例如, statuses_count:1000..10000)。示例: to:api statuses_count:10*注意:*仅适用于 PowerTrack 与 Historical PowerTrack。 |
| 粉丝_count: | 当作者的关注数处于指定范围时匹配 Posts。 如果指定单个数字,将匹配任何大于或等于该数字的值。 可以指定一个范围来匹配该范围内的任意数字(例如, followers_count:1000..10000)。*注意:*仅在 PowerTrack 和 Historical PowerTrack 中可用。 |
| 好友_计数: | 当作者的关注数(其关注的用户数量)在指定范围内时,匹配 Posts。 如果只指定一个数字,则任何大于或等于该数字的数值都会匹配。 可以指定一个范围来匹配该范围内的任意数值(例如, friends_count:1000..10000)。*注意:*仅适用于 PowerTrack 和 Historical PowerTrack。 |
| 已列出_计数: | 当作者在 X 上被加入列表的次数处于指定范围内时,匹配 Posts。 如果只指定一个数字,则会匹配任何大于或等于该数字的数值。 可以指定一个范围来匹配该范围内的任意数字(例如, listed_count:10..100)。*注意:*仅适用于 PowerTrack 和 Historical PowerTrack。 |
| $ | 匹配任何包含指定“cashtag”实体的 Post。 示例: ($TWTR OR $TSLA OR $BRK.A) -$F注意:“cashtag” 运算符依赖 X’使用 X 的“symbols”实体提取来匹配 cashtag,而不是直接从正文中提取。 |
| 转推_“of:” | 匹配对指定用户的 Post 进行转发的内容。 同时支持用户名和数字形式的 X 账号 id(不是 Post 状态 id)。 示例: (retweets_of:2244994945 OR retweets_of:api OR retweets_of:twittereng) -retweets_of:jack |
| 转推_的_状态_id: | 仅返回指定 Post 的显式转发。请使用原始 Post 的 id,而非某个转发的 id。 示例: retweets_of_status_id:1293593516040269825*注:*仅限 PowerTrack 和 Historical PowerTrack 使用。 |
| 于_回复_至_状态_id: | 仅投递对指定 Post 的直接回复。 示例仅传递对指定 Post 的直接回复。 示例: in_reply_to_status_id:1293593516040269825注意:仅适用于 PowerTrack 和 Historical PowerTrack。 in_reply_to_status_id:1293593516040269825*注意:*仅适用于 PowerTrack 与 Historical PowerTrack。 |
| 示例: | 返回与某条规则匹配的 Post 的随机样本。样本比例必须是 1 到 100 之间的整数。 运算符将范围缩减至 X%,然后把规则/过滤器应用到该抽样子集。 示例: #happybirthday sample:5"生日快乐"~5 sample:80*注意:*仅适用于 PowerTrack 和 Historical PowerTrack。 |
| 来源: | 匹配由指定源应用生成的任何 Post。该值可以是应用名称或该应用的 URL。 示例: #happybirthday source:"适用于 iPhone 的 X""这是一条来自我的 TestingApp 的测试 X" source:MyTestAppName*注:*source 运算符会基于 Post 的 source 属性进行搜索,且不能单独使用。 |
| lang: | 匹配被 X 归类为特定语言的 Post。当前每条 Post 仅被归类为一种语言,因此同时匹配多种语言将不会返回结果。不建议单独使用。 |
| 阿姆哈拉语: am | 德语: de | 马拉雅拉姆语: ml | 斯洛伐克语: sk |
| 阿拉伯语: ar | 希腊语: el | 迪维希语: dv | 斯洛文尼亚语: sl |
| 亚美尼亚语: hy | 古吉拉特语: gu | 马拉地语: mr | 索拉尼库尔德语: ckb |
| 巴斯克语: eu | 海地克里奥尔语: ht | 尼泊尔语: ne | 西班牙语: es |
| 孟加拉语: bn | 希伯来语: iw | 挪威语: no | 瑞典语: sv |
| 波斯尼亚语: bs | 印地语: hi | 奥里亚语: or | 他加禄语: tl |
| 保加利亚语: bg | 拉丁化印地语: hi-Latn | 旁遮普语: pa | 泰米尔语: ta |
| 缅甸语: my | 匈牙利语: hu | 普什图语: ps | 泰卢固语: te |
| 克罗地亚语: hr | 冰岛语: is | 波斯语: fa | 泰语: th |
| 加泰罗尼亚语: ca | 印度尼西亚语: in | 波兰语: pl | 藏语: bo |
| 捷克语: cs | 意大利语: it | 葡萄牙语: pt | 繁体中文: zh-TW |
| 丹麦语: da | 日语: ja | 罗马尼亚语: ro | 土耳其语: tr |
| 荷兰语: nl | 卡纳达语: kn | 俄语: ru | 乌克兰语: uk |
| 英语: en | 高棉语: km | 塞尔维亚语: sr | 乌尔都语: ur |
| 爱沙尼亚语: et | 韩语: ko | 简体中文: zh-CN | 维吾尔语: ug |
| 芬兰语: fi | 老挝语: lo | 信德语: sd | 越南语: vi |
| 法语: fr | 拉脱维亚语: lv | 僧伽罗语: si | 威尔士语: cy |
| 格鲁吉亚语: ka | 立陶宛语: lt |
| 操作符 | 说明 |
|---|---|
| 位置 | 匹配带有指定位置或 X 地点 ID 标签的 Post。 包含多个词的地名应加引号。 示例: (place:London OR place:"Great Britain") -place:USAplace:fd70c22040963ac7**注意:**请参阅GET geo/search用于获取 X 地点 id 的公共 API 端点。 **注意:**不会匹配转发(Retweet)或引用转发(Quote Tweet),因为转发的位置信息附加在原始 Post 上。 |
| 位置_国家/地区 | 匹配带有已标记地点/位置且其关联的国家/地区代码与给定 ISO alpha-2 字符代码相符的 Posts。 示例: place_country:GB OR place_country:AU OR place_country:CA注意不会匹配转推(Retweet)或引用推文(Quote Tweet),因为转推的位置信息附加在原始 Post 上。 有效的 ISO 代码:ISO 3166-1 双字母代码。 |
| 要点_radius:[经度 纬度 半径] | 在定义的半径内,匹配 Post 的精确位置 (x,y) 或“Place”地理多边形。 - 半径:<25 英里 - 支持的单位:英里(mi)、千米(km) - 经度:±180 - 纬度:±90° 坐标以十进制度表示。 参数用方括号括起,使用空格分隔。 示例: point_radius:[-105.27346517 40.01924738 0.5mi]示例: point_radius:[2.355128 48.861118 16千米]**注意:**不适用于转推或引用推文。 |
| 界定_box:[west_经度 南_纬度 东向_长北_lat] | 匹配边界框内的精确位置,或边界框中完全包含的“Place”地理多边形。 参数用方括号括起,以空格分隔。 坐标:十进制度(经度 ±180,纬度 ±90)。 必须设置宽度和高度<25 英里 示例: bounding_box:[-105.301758 39.964069 -105.178505 40.09455]注意不会匹配转推(Retweets)或引用推文(Quote Tweets)。 |
| 个人资料_国家 | 匹配作者个人资料地理位置的国家代码与指定 ISO‑3166‑1‑alpha‑2 两字母代码相同的 Posts。 |
| 个人资料_区域 | 对作者资料的地理信息增强中“region”字段进行匹配,要求精确的全字符串匹配。 对包含空白或标点符号的子字符串使用双引号。 示例: profile_region:"New York" |
| 个人资料_所在地 | 对作者资料的地理信息扩充中的“locality”字段进行匹配,需为精确的全字符串匹配。 对于包含空白字符或标点的子字符串,请使用双引号。 示例: profile_locality:"旧金山" |
| 个人资料_子区域 | 匹配作者个人资料地理增强中的“subRegion”字段,包括特定县或都会区。 完整字符串的精确匹配。 示例: profile_subregion:"圣克拉拉县" |
| has:geo | 将来自 X 的 Posts 与其特定的地理位置信息进行匹配,包括 “geo” 经纬度,或带有显示名称与地理多边形的 “Place” 位置数据。 **注意:**使用 Search API 时,必须与非— is:或has:操作符。 |
| has:profile_地理位置 | 匹配包含任意 Profile Geo 元数据的 Post,不论具体值为何。 可用别名: has:derived_user_geo。**注意:**使用 Search API 时,必须与非 is:或has:操作符。 |
| has:links | 匹配在有效负载的 text 对象中包含链接或被引用媒体的 Post,包括媒体与引用 Post(Quote Tweets)。“文本”有效负载中的对象,包括媒体和引用的 Tweet。 **注意:**使用 Search API 时,必须与非 — is:或has:运算符。 |
| is:retweet | 仅返回明确的转推。可取反以排除转推,仅返回原始内容。 此运算符仅匹配真正的转发(Retweets),不包含引用推文(Quoted Tweets)。 **注意:**使用 Search API 时,必须与非— is:或has:运算符。 |
| is:reply | 仅返回显式回复。可取反以排除回复。 PowerTrack 会匹配对原始 Post 的回复、被引用的 Post 中的回复,以及 Retweet 中的回复。 Search API 仅匹配针对原始 Post 的回复。 示例: @XDevelopers -is:reply |
| is:quote | 仅返回引用 Tweet 或引用其他 Post 的 Post。 可取反以排除引用推文。 示例: @XDevelopers is:quote |
| is:verified | 仅返回来自“已认证”作者的 Post。可通过取反来排除来自已认证作者的 Post。 示例: @XDevelopers is:verified |
| has:mentions | 匹配提及其他 X 用户的 Post。 **注意:**使用 Search API 时,必须与非— is:或has:操作符。 |
| has:hashtags | 匹配包含话题标签的 Post。 **注意:**与 Search API 搭配使用时,必须与非 is:或has:操作符。 |
| has:media | 匹配包含由 X 归类的媒体 URL 的 Posts(例如:pic.x.com)。 可用别名: has:media_link。**注意:**使用 Search API 时,必须与非— is:或has:操作符。 |
| has:images | 匹配包含媒体 URL(例如 pic.x.com)的 Post。 **注意:**使用 Search API 时,必须与非— is:或has:操作符。 |
| has:videos | 匹配包含在 X 上上传的原生 X 视频的 Post。 可用别名: has:video_link.此运算符不会匹配来自 YouTube、Periscope 或其他视频托管网站的视频。 **注意:**与 Search API 搭配使用时,必须与非 is:或has:运算符。 |
| has:symbols | 匹配包含股票代号符号的 Post(例如 $TWTR)。 **注意:**使用 Search API 时,必须与非— is:或has:操作符。 |
按产品分类的运算符
规则与筛选:企业版
| 操作符 | 产品 | 说明 | 对有效负载元素的匹配 |
|---|---|---|---|
| ”精确词组匹配” | PowerTrack 搜索 | 匹配 Post 正文中的精确短语。 可转换为搜索运算符的组件将被视为普通词项。换句话说: - "#标签"将会匹配hashtag但不包括#hashtag(使用该“hashtag” 运算符不加引号,以匹配实际的主题标签)- "$TWTR"将匹配该单词TWTR但不包括该现金标签$TWTR(使用该现金符号标签运算符不加引号以匹配实际的现金标记)**注意:**在 30 Day Search 和 Full Archive Search(企业版与 Premium)中,标点符号不会被分词,而是按空白字符处理。 | text |
| @ | PowerTrack 搜索 | 匹配任何提及指定用户名的 Post。该值可以是用户名(不包含@字符)或用户的数字 id,或(例如通过 GET users/lookup 端点获取)。GET users/lookup端点)。 | entities.user_mentions |
| # | PowerTrack 搜索 | 匹配任何包含指定话题标签的 Post。 此运算符执行精确匹配。例如,表示该规则 #1989将匹配包含该精确话题标签的 Post#1989,但不包括带有该主题标签的内容#TaylorSwift1989。**注意:**此运算符依赖 X’使用实体抽取来匹配话题标签,而不是直接从正文中提取话题标签。有关实体中的 JSON 属性的更多信息,请参阅X 实体。 | entities.hashtags |
| $ | PowerTrack 搜索 | 匹配任何包含指定现金标签(其标记的首字符为$)。**注意:**此运算符依赖 X’使用实体提取来匹配链接,而不是直接从正文中提取链接。有关实体中的 JSON 属性的更多详细信息,请参阅X 实体。 | entities.symbols |
| 简介: | PowerTrack | 可用的别名: 用户_简介: 在 Post 的用户简介中匹配关键词(使用分词匹配)或短语。使用双引号匹配整段短语。也就是说: - bio:软件工程师将匹配包含该关键字的 Post工程师来自个人资料含有该词的用户软件在其简介中- bio:"软件工程师"将匹配由其帖子中包含该短语的用户发布的任何 Post软件工程师在其简介中 | user``.description |
| 个人简介_位置: | PowerTrack | 可用的别名:user_简介_位置: 匹配以下条件的 Post:User 对象’的位置包含指定关键字(基于分词匹配)或短语。 该位置是非标准化的、由用户生成的自由格式字符串,与 Post 不同’的位置(如可用)。 | user.location |
| 个人简介_name: | PowerTrack | 匹配符合以下条件的 Post:User 对象’名称包含指定的关键词(使用分词匹配)或短语。 | user.name |
| 界定_框: | PowerTrack 搜索 | 可用的别名: 地理位置_界定_框 对 Post(如有)的精确位置(经度、纬度)进行匹配,并对地理多边形进行匹配(当 Place 完全位于所定义区域内时)。 - 西部_经度 南_lat 表示边界框的西南角,其中 west-long 是该点的经度,south_lat 表示纬度。 - 东部_经度与北向_lat 表示边界框的东北角,其中 east_long 表示该点的经度,north 表示北向_lat 表示纬度。 - 边界框的宽度和高度必须小于 25 英里 - 经度取值范围为 ±180 - 纬度范围为 ±90° - 所有坐标均使用十进制角度表示。 - 规则参数用方括号括起,使用空格分隔。 **注意:**针对 place(Post 地理信息)进行匹配的运算符仅会返回来自原始 Post 的匹配结果。转发(Retweets)不包含任何 place 数据。 | place(仅原始 Post) |
| 包含: | PowerTrack | 对子串的匹配:只要 Post 正文包含给定子串即可匹配,与分词无关。换言之,这是纯粹的子串匹配,不考虑词边界。 使用双引号以匹配包含空白或标点的子字符串。 | 文本 |
| <Emoji> | PowerTrack 搜索 | 匹配 Post 正文中的表情符号。 这是一次基于分词的匹配,因此您的表情符号将与 Post 正文的分词文本进行匹配。分词基于标点、符号/表情符号以及分隔符等 Unicode 基本平面字符。举例来说,文本为“I like 🍕”的 Post 会被拆分为以下词元:I、like、🍕。然后这些词元将与您在规则中使用的表情符号进行比对。 **注意:**如果某个表情符号有变体,你必须用双引号将其添加到规则中。 | text |
| 关注者_计数: | PowerTrack | 当作者的粉丝数在指定范围内时,匹配 Post。 - 单个数字(例如: followers_count:42) 将匹配任何大于或等于指定值的数字。- 一个区间(例如 followers_count:42..1337)将匹配给定范围内的任何数字。 | user.followers_count |
| 好友_计数: | PowerTrack | 可用的别名:关注_计数: 当作者的关注数(其关注的用户数量)落在指定范围内时,匹配 Post。 - 单个数值(例如 followers_count:42)将匹配任何大于或等于指定值的数值。- 一个范围(如 followers_count:42..1337)将匹配给定范围内的任意数字。 | user.friends_count |
| 发件人: | PowerTrack 搜索 | 匹配特定用户发布的任意 Post。该值可以是用户名(不包含@字符)或用户的数字 ID(例如通过 GET users/lookup 端点获取)。GET users/lookup终端节点)。 | user.id,user.id_str(如果使用用户id)user.screen_name(如果使用用户名) |
| has:geo | PowerTrack 搜索 | 匹配包含 X 提供的、Post 专属地理定位数据的 Post。该数据可以是“geo”经纬度坐标,或以 X 的“location”形式提供地点,与相应的显示名称、地理多边形及其他 fields。 不能作为独立运算符使用。 **注意:**基于 place(Post 地理信息)进行匹配的运算符只会匹配原始 Post。转发不包含任何 place 数据。 | place(仅限原始 Tweet) |
| has:hashtags | PowerTrack 搜索 | 匹配至少包含一个话题标签的 Post。 不能作为独立版的运算符使用。 | entities.hashtags |
| has:images | PowerTrack 搜索 | 匹配包含至少一个已分类图像 URL 的 Post。 不能作为独立运算符使用。 | entities.media |
| has:lang | PowerTrack | 匹配被 X 归类为特定语言的 Post。 如果某条 Post 尚未被分类,该运算符将不会匹配。当前每条 Post 仅被归类为一种语言,因此将多个语言条件用 AND 组合不会返回任何结果。 不能单独用作运算符。 | lang当值不为and |
| has:links | PowerTrack 搜索 | 此运算符用于匹配在 Post 正文中包含链接的 Post。 不能单独作为运算符使用。 **注意:**此运算符依赖于 X’使用 X 的实体抽取来匹配链接,而不是直接从正文中提取链接。有关实体中的 JSON 属性的更多详情,请参阅X 实体。 | entities.urls |
| has:media | PowerTrack 搜索 | 可用的别名: has:media_链接 匹配包含至少一个已分类媒体 URL 的 Post。 不能作为独立版的运算符使用。 | entities.media |
| has:mentions | PowerTrack 搜索 | 匹配提及其他 X 用户的 Post。 不能作为独立运算符使用。 | entities.user_mentions |
| has:profile_地理位置 | PowerTrack 搜索 | 可用的别名:has:derived_用户_地理位置 匹配包含任意个人资料地理位置无论其实际值为何,均视为元数据。 不能作为独立运算符使用。 | user.location |
| has:symbols | PowerTrack 企业版 | 匹配包含股票代号符号的 Post(例如:TWTR`)。 不能单独作为运算符使用。 | entities.symbols |
| has:videos | PowerTrack 搜索 | 可用的别名:has:video_链接 匹配包含至少一个已分类媒体 URL 的 Post。 不能作为独立运算符使用。 | entities.media |
| 在_回复_至_状态_id: | PowerTrack | 可用的别名:在……内_回复_至_Tweet_id: 仅投递对指定 Post 的明确回复。 | id,id_str目标 Post 的 |
| is:quote | PowerTrack | 传递与规则匹配的明确 Quote Tweets。 它也可以取反( -is:quote) 以从投放中排除符合规则的引用 Tweet。不能单独作为运算符使用。 | is_quote_status(iftrue) |
| is:reply | PowerTrack 搜索 | 仅返回符合规则的回复。 也可以取反( -is:reply)以排除投放符合指定规则的回复。在 PowerTrack 中,此运算符将匹配: - 对原始 Post 的回复 - 被引用的 Post 中的回复 - 转推中的回复 与 Search API 搭配使用时,此运算符将匹配对原始 Post 的回复,但不包含引用 Tweet 中的回复,也不包含 Retweet 中的回复。 您可以将这些运算符与 is:retweet及is:quote仅传递对原始 Post 的回复。不可在 Search API 中单独作为运算符使用。 注意事项: 使用 Premium 时,此运算符在 Sandbox 开发环境中不可用。 | 回复元素,例如:in_reply_to_status_id |
| is:retweet | PowerTrack 搜索 | 仅投递与规则匹配的显式转发(Retweet)。 它也可以取反( -is:retweet) 以将符合规则的转推从投递中排除,仅投递原始内容。此运算符仅匹配真正的转推(即通过“转推”按钮发布的转推)。引用的 Tweet 和未使用 X 转推功能的修改版 Post 将不会被此运算符匹配’其转发功能不会被此运算符匹配。 不能单独作为运算符使用。 | 转推元素,例如 retweeted_status``retweeted_status |
| is:verified | PowerTrack 搜索 | 仅投递作者已在 X 上通过验证的 Post。 也可以将其取反,以排除作者已通过 X 验证的 Post。 不能作为独立运算符使用。 | user.verified |
| 关键字 | PowerTrack 搜索 | 匹配 Post 正文中的关键字。 这是一次基于分词的匹配,这意味着你的关键词字符串将与 Post 正文分词后的文本进行匹配。分词依据标点符号、符号/表情符号,以及分隔符类的 Unicode 基本多文种平面字符。例如,文本为“I like coca-cola”的一条 Post 将被拆分为以下词元: 我,喜欢,coca,cola。然后会将这些标记与您在规则中使用的关键字字符串进行比较。要匹配包含标点符号(例如 coca-cola)、符号或分隔符字符的字符串,您必须使用精确短语匹配操作符。 | 文本 |
| lang: | PowerTrack 搜索 | 匹配那些已被 X 归类为特定语言的 Post(且仅在该 Post 已被归类的情况下)。每个 Post 只会被归为一种语言,因此将多个语言条件用 AND 同时组合将不会返回任何结果。 **注意:**如果无法进行语言分类,则提供的结果为 and(用于表示 undefined)该运算符仅会匹配受支持的语言。提供任何其他值(包括 und) 将导致该运算符被忽略(也就是说,不会按此运算符筛选 Posts)。下面的列表列出了当前支持的语言及其对应的 BCP 47 语言标识符:am阿姆哈拉语hu匈牙利语pt葡萄牙语ar阿拉伯语is冰岛语ro罗马尼亚语hy亚美尼亚语in印度尼西亚语ru 俄文俄语bn孟加拉语它意大利文sr塞尔维亚语bg保加利亚语ja日文sd信德语my缅语kn卡纳达语si僧伽罗语zh中文km高棉语sk斯洛伐克语cs捷克语ko韩文sl斯洛文尼亚语da丹麦语lo老挝语ckb索拉尼库尔德语nl荷兰语lv拉脱维亚语es西班牙语en 英文英语lt立陶宛语sv瑞典语et爱沙尼亚语ml马拉雅拉姆语tl他加禄语fi芬兰语dv迪维希语ta泰米尔语fr法文mr马拉地语te泰卢固语ka格鲁吉语ne尼泊尔语th泰语德语德文否挪威语bo藏语el希腊语或奥里亚语tr土耳其语gu古吉拉特语pa旁遮普语uk乌克兰语ht海地克里奥尔语ps普什图语ur乌尔都语iw希伯来语fa波斯语ug维吾尔语你好印地语pl波兰语vi越南语cy威尔士语 | lang当值不为und |
| 已列出_计数: | PowerTrack | 可用的别名: 用户_于_列表_计数: 当作者在 X 上被加入列表的次数处于给定范围内时,匹配 Posts。 - 单个数值(例如 listed_count:42)将匹配任何大于或等于指定值的数值。- 一个区间(例如 listed_count:42..1337) 将匹配给定范围内的任何数字。 | user.listed_count |
| 位置_国家: | PowerTrack 搜索 | 匹配带有标签的国家/地区代码与给定的 ISO alpha-2 字符代码 相符的 Post地点/位置与给定项匹配ISO Alpha-2 国家/地区代码。 **注意:**匹配 place(Post 地理信息)的运算符仅会返回来自原始 Post 的匹配结果。转发(Retweets)不包含任何 place 数据。 | place(仅限原始 Post) |
| 位置: | PowerTrack 搜索 | 匹配带有指定位置标签的 Posts,或X 地点ID。多词地名应加引号(例如place:"San Francisco")**注意:**在基于 place(Post 地理信息)进行匹配时,只会匹配原始 Post。转发不包含任何 place 数据。 | place(仅原始 Post) |
| 要点_半径: | PowerTrack 搜索 | **注意:**基于 place(Post 地理信息)的匹配运算符仅匹配原始 Post。转发不包含任何地点数据。 | place(仅原始 Post) |
| 个人资料_包围_box:[west_经度 南纬_纬度 东向_经度向北_纬度] | PowerTrack | 与该用户的匹配’在 Profile Geo enrichment 中与用户的精确位置(经度、纬度)匹配,且该地点完全包含在所定义的区域内用户资料地理信息增强其中该 Place 完全位于所定义的区域内。 - 西部_经度 南_lat 表示边界框的西南角,其中 west-long 为该点的经度,south_lat 表示纬度。 - 东部_经度与北纬_lat 表示边界框的东北角,其中 east_long 表示该点的经度,north 表示北_lat 表示纬度。 - 边界框的宽度和高度必须小于 25 英里 - 经度范围为 ±180° - 纬度范围为 ±90° - 所有坐标均使用十进制度表示。 - 规则参数置于方括号内,并以空格分隔。 **注意:**对 place(Post 地理)进行匹配的运算符只会返回来自原始 Post 的匹配结果。转发(Retweet)不包含任何 place 数据。 | user.derived.locations.geo.coordinates |
| 个人资料_国家: | PowerTrack 搜索 | 与以下内容的国家/地区代码精确匹配资料地理信息丰富化。 使用基于 … 的一组标准化两字母国家/地区代码,ISO 3166-1 alpha-2 标准. 为简洁起见,此运算符用于替代地址对象中的 country 字段对应的运算符。 注意对 place(Post 地理)进行匹配的运算符仅会返回来自原始 Post 的匹配结果。转发不包含任何地点数据。 | user.derived.locations.country_code |
| 个人资料_locality: | PowerTrack 搜索 | 与以下项的“Locality”字段完全匹配Profile 地理信息增强. 这是一个完全精确的字符串匹配。 无需使用反斜杠来转义字符。例如,如果要匹配包含斜杠的内容,请使用 one/two。使用双引号匹配包含空格或标点的子字符串,例如: profile_locality:"Lower East Side"。 | user.derived.locations.locality |
| 个人资料_要点_半径:[经度 纬度 半径] | PowerTrack | 与用户的精确位置(x,y)匹配’s个人资料地理信息充实。 - 支持的半径单位为英里(mi)和公里(km)。 - 半径必须小于 25 英里。 - 经度范围为 ±180° - 纬度范围为 ±90° - 所有坐标均采用十进制度表示。 - 规则参数置于括号内,并以空格分隔。 **注意:**在 place(Post 地理信息)上进行匹配的运算符仅会匹配原创 Post。转发不包含任何 place 数据。 | user.derived.locations.geo |
| 个人资料_region: | PowerTrack 搜索 | 与 Profile Geo enrichment 中的“Region”字段精确匹配个人资料地理信息扩充。 这是一个完全精确的字符串匹配。 不必使用反斜杠来转义字符。例如,如果需要匹配包含斜杠的内容,请使用 one/two。使用双引号来匹配包含空白字符或标点的子字符串,例如 profile_locality:"New York". | user.derived.locations.region |
| 个人资料_子区域: | PowerTrack | 与以下内容的 Subregion 字段精确匹配个人资料地理信息丰富化。 这是一个完全精确的字符串匹配。 不必用反斜杠对字符进行转义。例如,要匹配包含斜杠的内容,请使用 one/two.使用双引号匹配包含空白字符或标点符号的子字符串,例如: profile_locality:"金斯县". | user.derived.locations.sub_region |
| ”keyword1 keyword2”~N | PowerTrack 搜索 | 通常称为“邻近”运算符,它会匹配关键词彼此之间相距不超过 N 个标记的 Post。 如果关键字的顺序相反,则它们之间的距离不得超过 N-2 个标记。 引号内可包含任意数量的关键字。 N 不得大于 6。 | 文本 |
| 转发数_的_状态_id: | PowerTrack | 可用别名:转推_的_Tweet_id: 仅投递指定原始 Post 的显式 Retweet。 | retweeted_status.id,retweeted_status.id_str |
| 转推_of: | PowerTrack 搜索 | 可用的别名:转发_的_用户: 匹配任何为指定用户转发(Retweets)的 Post。该值可以是用户名(不包含 @字符)或用户的数字 id(例如可通过 GET users/lookup 端点获取)。GET users/lookup端点)。 | retweeted_status.id(如有) |
| 示例: | PowerTrack | 返回与某条规则匹配的 Posts 的随机比例样本,而非全部 Posts。该比例必须用 1 至 100 之间的整数表示。 此运算符适用于整个规则,并要求对所有使用 OR 连接的项进行分组’d 个术语需要分组。 **注意:**sample 运算符会先将 firehose 的范围缩减至 X%,然后再对该抽样子集应用规则/筛选器。例如,如果你使用, sample:10,每条 Post 被抽样的概率为 10%。**注意:**采样是确定性的,因此无论是实时获取还是事后拉取历史数据,您都会得到相同的数据样本。 | |
| source: | PowerTrack | 匹配由指定来源应用生成的任意 Post。该值必须为应用名称或应用的 URL。 不能作为独立运算符使用。 | source |
| 状态_计数: | PowerTrack | 可用的别名: 推文_计数: 当作者发布的状态数在给定范围内时,匹配 Posts。 - 单个数字(例如: statuses_count:42)将匹配任何大于或等于指定值的数字。- 一个区间(例如 statuses_count:42..1337)将匹配给定范围内的任意数字。 | user``.statuses_count |
| 收件人: | PowerTrack 搜索 | 匹配任何回复特定用户的 Post。取值可以是用户名(不含@字符)或用户的数字 ID(例如通过 GET users/lookup 端点获取)。GET users/lookup终端点)。 | text |
| URL: | PowerTrack 搜索 | 对 Post 的扩展 URL 执行基于分词的匹配。包含标点或特殊字符的词元或短语应使用双引号括起(例如url:"/developer")。虽然通常不建议这样做,但该运算符也可以匹配特定协议,并将其用双引号括起来(例如, url:"https://developer.x.com")。 | entities.urls.expanded_url |
| url_包含: | PowerTrack | 对(新的)扩展 URL 标题元数据增强执行关键词/词组匹配扩展 URL 标题的元数据增强。 | entities.urls.expanded_url |
| URL_说明: | PowerTrack | 可用的别名:在……之内_url_说明: 在(新)上执行关键字/短语匹配扩展的页面描述元数据富化。 | entities.urls.unwound.description |
| url_title: | PowerTrack | 可用的别名:在……之内_url_title: 对(新的)执行关键字/短语匹配扩展的 URL 标题元数据增强。 | entities.urls.title |