リアルタイムで返信を管理する
- ユーザーの Posts を読み取り、返信の非表示/再表示を行うための許可をユーザーに求めます。
- 受信した返信を検出するために Account Activity API を使用します。
- Perspective API に「スコア」(0〜1 の数値)を要求し、コメントが過去に観測された有害なコメントに類似しているとアルゴリズムがどの程度確信しているかを示します(Perspective はサービスに送信されたテキストを保存しません)。
- アルゴリズムのスコアが非常に高い場合は、返信を非表示にする API 呼び出しを行います。
透明性の確保に努める
- 最善の選択肢は、常にユーザーを信頼し、意思決定の主導権を完全にユーザーに委ねることです。つまり、ユーザー体験には、アプリがユーザーに代わって実行したあらゆる操作を取り消せるコントロールを含めるべきです。
- 人工知能を使用する場合、アプリは Posts を検出して非表示にする際に、非常に高い信頼度のしきい値を用いるべきです。
- すべての人が同じ言葉を使うわけではないため、アプリはバイアスを避けるよう設計する必要があります。誤検知につながり得るリクレイムドワードやスラングには注意してください。
- 人工知能を学習させる場合は、X で頻繁に使われる言語を的確に反映するモデルの採用を検討してください。